Если делать на основе триггеров - лажа будет...
Не, ну это понятно, что чтобы научить нейросеть различать музыкальные понятия из всего-лишь переменного во времени напряжения - нужно сперва как-то так этот поток трансформировать, чтобы... ну фиг знает, вот лица же научили различать, и не только лица... игрался как-то с какой-то программой, которой подсовывешь картинку, а нейросеть пишет - ЧТО, скорее всего, - на ней изображено... упорно пытался этой проге скормить всякие порнокартинки, зараза... нейросеть-монашка какая-то
Но суть то в том, что нейросеть может делать понятийные различения картинок, значит и звуковое полотно теоретически можно научить фильтровать по понятиям, типа "в этом аудиообразце басист не попадает в ритм, а барабанщик, скорее всего - и вовсе пьян" ))
Думать, конечно, нейросеть не может, т.е. абстрагироваться как-то там и сама себя учить различать новые понятия, формировать новые понятия и т.д...
Но на том уровне - на котором и учатся умнеть большинство человекообразных существ - вполне уже и нейросетка могет, в смысле, когда в мозгу складываются нужные связи благодаря дрессировке внешними обстоятельствами, кнутом и пряником
Насколько техническая сторона важна - тоже фиг знает
Вот я слышал мнение, что очень опытный звукорежиссер способен и на перделках услышать что-то такое, что не опытный только на мониторах услышит, и то не факт...
В данном случае техническую разрешающую способность заменяет - накопленный опыт
В плане нейросети - накопление опыта - это и есть то самое "научение" ее, формирование у нее нужных связей со всеми отклонениями...
Т.е. тут еще зависит и от того - сколь долго и кропотливо дрючить нейросеть, пока она не научится различать по каким-то там нюансам..
Опять таки, действительно, чтобы узнать какое-то явление - мозгу нужно время... т.е. басист в таком случае бы дергал струну спустя там, послекунды - типа услышал что стучит бочка, но это еще не точно, прошло еще немного времени - а ну да - это точно был удар бочки, значит можно дернуть струну...
Но в реальности ведь не так, потому что нейросеть в наших головах уже давно заранее "знает" что там должно стучать и играть, и реагирует уже на автопилоте при самом раннем начале атаки. Мозг заранее ожидает - в какое мгновение должна стукнуть бочка - и дергает струну едва возникает малейший признак ожидаемого, а чаще и вовсе уже не слушая - так сказать - "войдя в поток"
То-исть, "вхождение в поток", "на автопилоте" - это когда нейросеть заранее знает уже все что должно произойти, и уже не анализирует детально, а действует тупо по сформированному совокупному "Знанию"