Ну, конкретно этим не я занимаюсь.
Но, насколько я понял, парсится таб в некую структуру и анализируется количество и сложность разнообразных приёмов игры. Плюс темп, сложность распальцовки и так далее. И по этим параметрам (взвешенным, разумеется) вычисляется общий балл сложности.
Ну вот очень интересно, как это балл считается. Ваши на хабре ничего такого не писали?
Спарсить табы - дело не хитрое, сами понимаете. Хитрое - оценить сложность ))
Просто путь 1 - это каждому приему (бенды, палм мутинг и всякая остальная фигня) дать свой вес, посчитать встречаемость и отсюда посчитать балл сложности, путь 2 - Руками разбить на сложные / не сложные композиции (обучающая выборка, supervised), пост построить модельку и потом по ней считать другие табы.
Можно, конечно, немного шагнуть в сторону, решив, что табы - это как алфавит и построить языковую модель (хотя бы с tf-idf начать), но это не сразу очевидно. Хотя и тут есть прорывные решения на бертах (а теперь и на gpt 4). И этот третий путь - это прям уууух, круто и сложно.
Короче, если кто из ваших моделистов может поподробнее рассказать о решении и архитектуре (тут или на какой другой площадке) - дайте знать. Если это именно МЛ - может, сможем договориться, в моей крупной гос компании у нас есть мл-сообщество, мы туда часто внешних спикеров зовем.
Ну и да, если вашим коллегам идеи покажутся интересными - кликните меня, попробую развить мысль. Больше, видимо, ветку грузить не стОит ))