Если голос четко в середине стерео, то L-R конвертируются в M-S (mid-side, есть такое представление стерео сигнала). В резултате почти весь голос будет в канале М. Там с ним делаешь что надо, а потом конвертируешь в L-R обратно....
Еще можно голос "выделит" плагином выдирания вокала (основан на игре с фазовыми сдвигами). Выдернутый вокал лечишь и подсовываешь обратно в общий микс...