А так не получится?
захват экрана и звука из DAW. Streaming, трансляция.
https://www.youtube.com/watch?v=Q_QvovHKp5w
... и добавил:
Ну, ессно, речь шла не про Бономассу, а про местного орга)
Для местного орга скорей всего (предположу) твой вариант
с вашими демо
может вполне подойти - т.е. отсылать ему раздельно аудиофайлы+видеофайлы без сведения с минусом.
Типо - "а пусть он сводит, крышу себе набекрень свернет - нам фиолетово, взятки гладки..."

Насчет твоих советов по обработке аудио+видео: Мак техника сильная и правильная, там либо работает,
либо не работает.
Виндоуз с Кубейсом - да еще если + видео обработка единовременно,
нужен довольно мощный комп с жирной видеокартой + мощная звуковая+проц
и даже в этом случае
могут быть траблы, патамушта - это не Мак хоть тресни.
В случае обывательского не профессионального создания видео на Винде -
надежно и просто записывать раздельно аудиофайл в качестве, синхронизированный с минусом,
с возможностью его постобработки чисто с коррекцией частот, уровней, тонального баланса
и видеофайл отдельным образом.
Я обычно совмещаю по звуку струн в видео, камера пишет первый удар по струне
и подставляю аудиофайл вручную синхронизирую в видеоредакторе.
Получается результат, с опытом.
Айфон позволяет записывать 60кадров/сек Full HD 1080 качество, пришлось купить 7+ модел.
До того записывал на телефоны андроиды - падлы живут своей жизнью,
как и старенький айфон 4S: то пишут видео 29,97 кадров/сек, то 26 кадров/сек,
в для видео на Ютуб в MP4 нужно разрешение 30кадров/сек минимум чтобы было 1080HD качество в итоге.
Если камера записывает 29,97 кадров/сек то на ролике длинной в пять и больше пяти минут
неминуемо будет расхождение картинки с звуком, т.е. руки/гриф будут якобы играть одно,
а звучать будет на пару миллисек раньше или позже, как повезет....