В этих профилях выше STFT использовался в обучении (с очень маленьким весом, т.к. он перетягивает на себя одеяло и сильно замедляет обучение метрик MSE, MAE), а вот MRSTFT с keras у меня не подружился, а натягивать сумму куч STFT с разными параметрами лень, гложет, что проще переписать на торч, для которого MRSTFT есть рабочий на примере NAM.
Но это про частотную правильность, а не про динамику =)
А недогейн проходит с бОльшим временем обучения, по крайней мере я его не чувствую при сравнении в лоб с профилем на NAM.
Косвенно для динамики - с небольшим весом в loss добавил лёгенький ESR с модулем вместо квадратов (получился EAR), в положительную сторону сказывается при игре уменьшенной ручкой громкости гитары.
Но пока не пробовал замерить точность с уполром на динамику, т.к. косвенно всё это должно отражаться в том же MSE, MAE, и особенно в ESR, EAR...
Меня больше напрягало, что относительно NAM, в NNM получался плоский менее телесный звук и всегда с характерным окрасом в верхних частотах, который я не встречал в других плагинах, как будто пальцы не только из кожи, но и немного из стекла... Этот окрас в некоторых профилях очень в тему, кстати) Но вот, убрав MPT со свёрточных слоёв и найдя комбинации переворотов весов, при которой в звук не добавлятся задержки - всё встало на свои места и зазвучало лучше тонекса из-за возмоности обучать дольше и отсутствии среза верхних частот=)