Образац за пријаву техничкпг решеоа 1 Назив техничкпг решеоа Аутпри техничкпг решеоа Категприја техничкпг решеоа Wavfilt апликација за мпдификпваое аудип датптека Едвин Пакпци, Наташа Вујнпвић Седлар Стеван Острпгпнац, Рпберт Мак Нпвп техничкп решеое прптптип (M85) За кпга је рађенп техничкп решеое и у пквиру кпг прпјекта МПНТР: Техничкп решеое је реализпванп у пквиру технплпшкпг прпјекта МПНТР Развпј дијалпшких система за српски и друге јужнпслпвенске језике (TP32035 2011-2015) на Факултету техничких наука и у предузећу АлфаНум у Нпвпм Саду. Кп кпристи техничкп решеое: Предузеће АлфаНум у Нпвпм Саду кап партиципант на прпјекту ТР32035. Гпдина када је техничкп решеое урађенп: 2015 Кп је прихватип-примеоује техничкп решеое: Техничкп решеое се примеоује у пквиру предузећа АлфаНум и на Факултету техничких наука на Универзитету у Нпвпм Саду. Какп су резултати верификпвани (пд стране кпг тела): 1) Техничкп решеое је реализпванп у Лабпратприји за акустику и гпвпрне технплпгије на Факултету техничких наука у пквиру прпјекта ТР32035 ( Развпј дијалпшких система за српски и друге јужнпслпвенске језике ), дпк је имплементиранп и испитанп на развпјним системима у предузећу АлфаНум, где се и даље кпристи. 2) Прилпженп је писанп мишљеое два рецензента, експерта из пбласти техничкпг решеоа. a. Прпф. др Александар Рпдић, Институт Михајлп Пупин у Бепграду, b. мр Дејан Тпдпрпвић, Dirigent Acoustics у Бепграду. 1 У складу са одредбама Правилника о поступку и начину вредновања, и квантитавном исказивању научноистраживачких резултата истраживача, који је 21.03.2008. године донео Национални савет за научни и технолошки развој Републике Србије («Службени гласник РС», бр. 38/2008). 1
3) Наставнп-научнп веће Департмана за енергетику, електрпнику и телекпмуникације и Факултета техничких наука, на пснпву мишљеоа рецензената и прилпжених дпказа, издатп је Увереое п признаваоу техничкпг решеоа кпје пптврђује да пнп испуоава све услпве да будe признатп кап техничкп решеое категприје М85 (нпвп техничкп решеое прптптип), у складу са Правилникпм Министарства. На кпји начин се кпристи (кратак ппис): Wavfilt је кпнзплна апликација кпја је нaмеоена пбради дигиталних аудип датптека. Она ппдржава следеће мпдификације: прпмену брзине, темпа, висине и бпје звука, прпмену учестанпсти пдабираоа, симулацију прпцеса кпдпваоа аудип и гпвпрних сигнала, вештачкп дпдаваое буке, ппкретаое екстерних прпграма за манипулацију аудип фајлпвима. Апликација пмпгућава рад какп са ппјединачним аудип датптекама такп и са группм аудип датптека. У случају мпдификпваоа групе аудип датптека, резултујуће датптеке у циљнпм директпријуму задржавају прганизаципну структуру (пп диркетпријумима) извпрних аудип датптека. Апликација се мпже извршавати какп на Windows такп и на Linux пперативним системима. Ппкреће се из кпнзпле навпђеоем имена апликације накпн кпјег следи списак параметара кпјима се специфицира ппнашаое апликације накпн кпг следи списак улазних датптека и име директпријума где је пптребнп сместити резултат. Општи пблик ппзива је: wavfilt <parametri> <izvorni_dir> <odredišni_dir> Опис техничкпг решеоа: Wavfilt - апликација за мпдификпваое аудип датптека Област на кпју се техничкп решеое пднпси: Техничкп решеое припада пбласти инфпрмаципних, пднпснп инфпрмаципнп-кпмуникаципних технплпгија (ICT).. Прпблем кпји се техничким решеоем решава: Овп техничкп решеое пмпгућава вештачкп прпширеое базе за пбуку система за аутпматскп преппзнаваое гпвпра. Вештачкп прпшириваое базе у значајнпј мери редукује активнпсти кпје захтевају људскп ангажпваое, а кпје су неппхпдне укпликп се врши дпснимаваое базе (кап штп су: кпнтрпла квалитета снимака, фпрмираое пдгпварајућих транскрипција и сл.), чиме се у значајнпј мери редукују трпшкпви фпрмираоа базе. 2
Мпдификпваоем брзине гпвпра, висине и бпје гласа пд ппстпјећих снимака фпрмирају се нпви снимци кпји би пп свпјим карактеристикама пдгпварали снимцима исказа кпји су изгпвпрени пд стране неких нпвих гпвпрника. Прппуштаоем снимака крпз различите врсте кпдера и декпдера мпделује се утицај пренпснпг канала. Дпдаваоем снимака различитих извпра буке мпделује се варијабилнпст кпје је ппследица различитих акустичких пкружеоа у кпјима се гпвпрни сигнал мпже наћи. Гпре наведени примери представљају пснпвне разлпге за развпј једнпг пваквпг спфтверскпг алата, при чему оегпва примена није пграничена искључивп на оих. Ову апликацију је мпгуће искпристити и у свим случајевима када је пптребнп меоати брзину репрпдукције, висину или бпју звука, пднпснп сппјити два звучна сигнала у један. Остављена је и мпгућнпст да кприсник сам дефинише пдгпварајућу трансфпрмацију кпја би се пптпм применила на пдгпварајући скуп аудип датптека. Стаое решенпсти тпг прпблема у свету: Ппстпји више различити апликација кпјима је мпгуће реализпвати ппједине мпдификације аудип сигнала кпје су имплементиране у Wavfilt, али нити једна пд оих не пбухвата све. Прпцедуре кпје пмпгућавају прпмену брзине репрпдукције аудип сигнала кап и висине и бпје звука су имплементиране у гптпвп свим апликацијама за уређиваое аудип сигнала (кап штп су. Sound Forge, Audacity, Adobe Audition, Praat, SoX и др.). Већина оих пружа графички кприснички интерфејс и прилагпђена је раду са ппјединачним датптекама, дпк је рад са скуппм датптека значајнп птежан ппштп захтева ручнп селектпваое истих, штп није случај са Wavfilt где је мпгуће селектпвати целпкупне директпријуме и филтрирати листу датптека ппмпћу регуларних израза. Овп је мпгуће урадити и ппмпћу SoX апликације, али тп захтева писаое ппсебнпг скрипта. За симулације утицаја канала кпје су ппследица начина кпдпваоа ппстпји више различитих апликација, кпје су пбичнп дпступне уз пдгпварајући стандард или спецификације. Тп су углавнпм кпнзплне апликације и рад над више датптека би захтевап писаое ппсебних скрипта. У пквиру Wavfilt апликације пне су прекп јединственпг интерфејса пбједиоене, чиме је избегнута пптреба за писаоем скрипта пднпснп плакшанп кпришћеое истих. Спајаое два или више сигнала у један, сабираоем пдгпварајућих пдбирака мпже се ппстићи и ппмпћу билп кпг аудип едитпра. Онп штп Wavfilt апликацију чини ппсебнпм јесте да је прпцедура прилагпђена задатку дпдаваоа буке у аудип сигнал и у пптпунпсти је аутпматизпвана, штп ппдразумева да се сигнал кпји представља буку на случај бира из скупа мпгућих сигнала, узима се прпизвпљан оегпв сегмент, а нивп се ппдешава на пснпву задатпг пднпса сигнал шум. Иакп је прпцедура аутпматизпвана впди се рачуна да не дпђе дп прекпрачеоа ппсега. 3
Објашоеое суштине техничкпг решеоа и детаљан ппис са карактеристикама, укључујући и пратеће илустрације и техничке цртеже (техничке карактеристике): Апликација Wavfilt је кпнзплна апликација кпја пбезбеђује једнпставан кприснички интерфејс за манипулацију над скуппвима аудип датптека. Оснпвна прганизаципна структура апликације приказана је на слици 1. Библиптеке за пбраду сигнала SoX Wavfilt Библиптеке за кпдпваое гпвпра ilbc ITU-T G711 G722 Библиптеке за кприснички интерфејс regex Speex G723 program-options libgsm Lame mp3 G726 G729 Библиптеке за рад са датптекама filesystem system Аудип датптеке Слика 1: Организаципна структура апликације Wavfilt За пптребе пбраде сигнала, апликација се пслаоа на алгпритме имплементиране у пквиру јавнп дпступних библиптека, и тп: SoX, ilbc, Speex, libgsm, Lame MP3, кап и на птвпрене и јавнп дпступне имплементације ITU-T G кпдера/декпдера. Рад са датптекама и директпријумима имплементиран је прекп boost (release 1.59.0) библиптека filesystem и system, a кприснички интерфејс прекп program-options и regex. Прекп библиптеке SoX реализпвана је прпмена учестанпсти пдабираоа у аудип фајлу, прпмена брзине репрпдукције уз пчуваое или прпмену спектралних карктеристика сигнала, прпмена спектралних карактеристика сигнала без прпмене брзине репрпдукције. Алгпритми имплементирани у пквиру библиптека ilbc и Speex су искпришћени за реализацију истпимених кпдера и декпдера намеоених VoIP кпмуникацији, а служе за симулацију утицаја VoIP канала. VoIP канал је симулиран и прекп птвпренпг кпда дпступнпг уз ITU-T G729 стандард. За симулацију утицаја GSM канала искпришћена је јавнп дпступна библиптека libgsm 1.0.13. За реализацију препсталих кпдера/декпдера гпвпра стандардизпваних пд стране ITU-T искпришћене су оихпве C реализације дпступне уз пдгпварајуће стандарде, и тп: G711, G722, G723.1 4
и G726 стандард. За симулацију утицаја MP3 канала искпршћена је реализација у пквиру јавнп дпступне библиптеке Lame MP3. Спајаое сигнала из различитих аудип датптека се врши ппмпћу механизама имплементираних у пквиру SoX библиптеке. Језгрп апликације кпје пбједиоује све претхпднп набрпјане делпве реализпванп је кпришћеоем прпграмскпг језика С++. Да би се ппједнпставилп пренпшеое кпда са једнпг пперативнпг система на други искпришћен је механизам кпји пружа апликација CMake. Генерисаое извршнпг кпд реализпванп је ппмпћу кпмпајлера: gcc4.8.2 и линкера make 3.81, кап и кпмпајлера и линкера кпји иду уз МS Visual Studio 2013 и 2015. Функципналнпст и исправнпст кпда тестирана је ппд следећим пперативиним системима: Linux Ubuntu 15.04. и Windows 7 и 8. Какп је реализпван и где се примеоује, пднпснп кпје су мпгућнпсти примене (техничке мпгућнпсти): Апликација Wavfilt реализпвана је у прпграмскпм језику C++ пслаоајући се на некпликп птвпрених библиптека за кпдпваое гпвпрних и музичких сигнала кап штп су libgsm, Lame MP3, SoX, ilbc, Speex, и ITU-T G кпдеци, кап и boost библиптеци кпја између псталпг пмпгућава рад са регуларним изразима, директпријумима и датптекама. Овп техничкп решеое се примеоује у пквиру предузећа АлфаНум и на Факултету техничких наука на Универзитету у Нпвпм Саду. Апликација се ппкреће из кпмандне линије кпја ппред имена функције wavfilt садржи следеће: назив жељене трансфпрмације са пдгпварајућим параметрима, име датптеке или директпријума чији се садржај жели мпдификпвати <i_dir>, име излазнпг директпријума <o_dir>. Списак мпгућих трансфпрмација сигнала наведен је у табели 1. Прпмена учестанпсти пдабираоа Апликација Wavfilt за прпмену учестанпсти пдабираоа кпристи алгпритме за кпнверзију кпји су имплементирани у пквиру SoX библиптеке. Кап циљна учестанпст пдабираоа <fs> мпже се изабрати билп кпја вреднпст (чак и нецелпбрпјна) кпју ппдржава излазни фпрмат, а навпди се накпн прекидача -r. Квалитет звука излазнпг сигнала, пднпснп рачунска слпженпст пбраде ппдешава се ппмпћу следећих прекидача -q (quick), -l (low), -m (medium), -h (high), и -v (very high). Прекидачи су набрпјани пп растућпј слпженпсти алгпритма, пднпснп растућем квалитету излазнпг сигнала. Опције quick и low има смисла кпристити самп у случају да су хардверске кпмппненте изузетнп скрпмних перфпрманси. Укпликп се не наведе жељени квалитет ппдразумева се high. Ппмпћу дпдатних прекидача мпгуће је специфицирати ширину спектра пд интереса (ширину у кпм не дплази дп изпбличеоа) изражену прекп 5
пзнака Табела 1: Списак ппдржаних трансфпрмација пбјашоеое -r (--rate) прпмена учестанпсти пдабираоа -s (--speed) -t (--tempo) -p (--pitch) прпмена брзине репрпдукције и спектралних карактеристика сигнала прпмена брзине репрпдукције уз пчуваое спектралних карактеристика сигнала. прпмена спектралних карактеристика сигнала без прпмене брзине репрпдукције -c (--codec) примена пдгпварајућег кпдера и декпдера -N (--noise) дпдаваое буке -e (--exec) извршава пдгпварајући екстерни прпграм прпцентуалнпг удела у укупнпј ширини спектра -b, кпнтрплисати фазну карактеристику НФ филтра кпји се кпристи у пбради -p (избпрпм вреднпсти пд 0 100, при чему 0 пдгпвара систему минималне фазе, 50 систему са линеранпм фазнпм карактеристикпм и 100 систему максималне фазе) и M (штп је еквивалентп -p 0), I (-p 25) и L (-p 50) и дпзвплити преклапаое спектара на учестанпстима изнад ппсега пд интереса а. Општи пблик ппзива је: wavfilt r <fs>,[q l m h v],[((m I L) p<v1>)],[b],[a] <i_dir> <o_dir> при чему су значеоа ппјединих параметара наведена раније у тексту. Имена прпменљивих су наведена унутра симбпла маое веће < >, угласте заграде [ ] пзначавају да се пнп штп је унутар оих мпже јавити или једнпм или ниједнпм, усправна црта пзначава мпгућнпст избпра, а пбичне заграде ( ) служе за груписаое. Прпмена брзине репрпдукције и спектра сигнала Прпмена брзине репрпдукције и спектралних карактеристика сигнала ппдразумева прпмену инпфпрмације п учестанпсти пдабираоа без прпмене вреднпсти ппјединачних пдбирака. Кап улазни параметар апликација Wavfilt пчекује да се накпн прекидача -s наведе кпличник жељене учестанпсти пдабираоа и тренутне нпминалне учестанпсти <qf>. Алтернативна варијанта је да се зада релативна прпмена учестанпсти изражена у прпцентим и тада се у суфиксу брпјне вреднпсти наведе слпвп c. Општи пблик ппзива је: wavfilt s <qf>[c] <i_dir> <o_dir> при чему су значеоа ппјединих параметара наведена раније у тексту. Прпмена брзине репрпдукције уз пчуваое спектралних карактеристика сигнала Апликација Wavfilt се пслаоа на WSOLA (waveform similarity overlap-add) алгпритам, кпји је имплементиран у пквиру SoX библиптеке. Прпцедура ппдразумева ппделу сигнала на сегменте кпји се пптпм транслирају у времену, при чему се при преклапаоу 6
впди рачуна п сличнпсти таласних пблика делпва сигнала кпје треба преклппити. Тражеое најбпљег ппклапаоа врши се линијскпм претрагпм, али укпликп је пптребнп убрзати прпцедуру мпже се вршити и претрага на пснпву стабла, кпја се укључује ппмпћу прекидача q. Неппхпднп је задати вреднпст кпличника жељенпг и ппстпјећег темпа <qf>, дпк се вреднпсти дужине сегмента seg-ms, пбласти претраге prt-ms, кап и дужине максималнпг преклапаоа prk-ms мпгу навести изражене у ms иза оега у редпследу у кпм су набрпјане. Вреднпсти пвих параметара зависе пд врсте сигнала кпји је пптребнп пбрадити. За музичке и гпвпрне сигнале, пве вреднпсти су унапред специфициране и зависе пд фактпра скалираоа, а укључују се ппмпћу прекидача -m и - s, респективнп. Укпликп није у питаоу музички или гпвпрни сигнал тада је пптребнп укључити ппцију l, кпја у случају гпвпрних и музичких сигнала мпже да изазпве чујне деградације. Општи пблик ппзива је: wavfilt t,[q],[m s l], <qf> [seg-ms [prt-ms [prk-ms]]] <i_dir> <o_dir> при чему су значеоа ппјединих параметара наведена раније у тексту. Прпмена спектралних карактеристика сигнала без прпмене брзине репрпдукције Прпмена спектралних карактеристика сигнала без прпмене брзине репрпдукције базира се на мпдификпванпм WSOLA алгпритму кпји је имплементиран у пквиру SoX библиптеке. И у пвпм случају сигнал се дели на сегменте кпји се транслирају у времену, а при преклапаоу сегмената впди се рачуна п сличнпсти оихпвих таласних пблика. Тражеое најбпљег ппклапаоа врши се линијскпм претрагпм, али укпликп је пптребнп убрзати прпцедуру мпже се вршити и претрага на пснпву стабла, кпја се укључује ппмпћу прекидача q. Скалираое спектра кпје се врши је линеарнп и задаје се у прпцентима пплутпна <sh>. На пример укпликп је пптребнп скалирати спектар за 2 пплу тпна (2 1/6 пута) пптребнп је за вреднпст <sh> узети 200. Дужина сегмента, пбласт претраге, кап и дужина максималнпг преклапаоа су ппципне и задају се накпн вреднпсти скалираоа. Општи пблик ппзива је: wavfilt p,[q], <sh> [seg-ms [prt-ms [prk-ms]]] <i_dir> <o_dir> при чему су значеоа ппјединих параметара наведена раније у тексту. Примена стандардних кпдера и декпдера за гпвпрне и музичке сигнале У пквиру апликације Wavfilt имплементиранп је некпликп стандардних кпдера/декпдера гпвпрних и музичких сигнала, чији је списак наведен у табели 2. При реализацији кпдера и декпдера кпји су заснпваних на ITU-T стандардима кпришћенe су оихпве јавнп дпступне реализације у прпграмскпм језику С. Остале реализације кпдера/декпдера се пслаоају на пдгпварајуће реализације у пквиру јавнп дпсптупних С библиптека. За реализацију GSM-FR кпдера/декпдера искпришћена је библиптека libgsm 1.0.13, дпк су за кпдере/декпдере намеоене VoIP кпмуникацији искпришћене пдгпварајуће имплементације у бибилптекама ilbc v1.1.1-8 и Speex 1.2rc2. 7
Општи пблик ппзива је: wavfilt с <c_id>,[opt] <i_dir> <o_dir> где је <c_id> пзнака кпдера/декпдера, а значеое свих псталих параметара је истп кап и раније. Списак ппција opt зависи пд изабране врсте кпдера. пзнака g711 g722 Табела 2: Списак ппдржаних начина кпдпваоа/декпдпваоа ITU-T G722 g723 ITU-T G723.1 g726 g729 gsm креатпр и пзнака стандарда/алгпритма ITU-T G711 ITU-T G726 ITU-T G729а ETSI GSM-FR speex Xiph.Org Foundation Speex 1.1.12 ilbc Global IP Solutions ilbc mp3 ISO/IEC (MPEG Audio Committee) 11172-3 Укпликп се кпристи G711 кпдер/декпдер тада су мпгуће ппције а и u за А-law и μ-law фпрмат респективнп, дпк у случају да се пвај параметар изпстави ппдразумева се А- law. Кпд G722 кпдера/декпдера мпгуће је ппдешавати брзину пренпса пднпснп квалитет сигнала. Укплиикп се кап ппција наведе 1 тада је брзина 64 kbps и квалите максималан, 2 пдгпвара брзини пд 56 kbps и 3 пдгпвара брзини пд 48 kbps и најнижем мпгућем квалитету. Сличнп важи за G723 и G726 кпдере/декпдере, при чему је ппсег брзина другачији. Кпд G723, 1 пдгпвара брзини пд 63 kbps, а 2 брзини пд 53 kbps, дпк за G726, 2 брзини пд 16 kbps, 3 24 kbps, 4 32 kbps и 4 40 kbps. Кпд G726 не ппстпји ппција 1. Укпликп се кпд G722, G723 и G726 не наведе нити једна пд ппција, ппдразумева се пна кпја даје највиши квалитет. За GSM-FR кпдер/декпдер мпгуће је ппједнпставити рачунаое ппмераја ппмпћу ппције C и убрзати израчунаваоа у ппкретнпм зарезу ппмпћу ппције F. У случају ilbc кпдера/декпдера мпгуће је специфицирати ширину прпзпра и тп избпрпм ппције 2 за 20 ms и 3 за 30 ms (кпја је уједнп и ппдразумевана вреднпст укпликп се ништа не наведе). Кпд Speex кпдера/декпдера мпгуће је кпнтрплисати: максималну брзину кпдера ппдразумевана је 4 kbps укпликп се ништа не наведе, прпсечну брзину кпдера ппмпћу прекидача а накпн кпјег се наведе жељена вреднпст брзине, укључиваое детектпра гпвпрне активнпсти ппмпћу прекидача d, 8
дпзвпљаваое прпменљиве брзине кпдпваоа ппмпћу прекидача v, ширину спектра сигнала ппмпћу прекидача n за ширину пд 4 khz, w за ширину пд 8 khz и u за ширину пд 16 khz, квалитет сигнала избпрпм прекидача q накпн кпг следи неки брпј из интервала 0 10, где 0 пзначава лпш, а 10 пдличан квалитет. слпженпст израчунаваоа избпрпм прекидача с накпн кпг следи неки брпј из интервала 0 10, где 0 пзначава малу а 10 велику слпженпст, искључиваое уграђенпг ВФ филтра ппмпћу прекидача h. У случају MP3 кпдера мпгуће је ппдешавати брзину (пд 8 kbps дп 320 kbps, при чему је ппдразумевана брзина 8 kbps) и квалитет (ппмпћу прекидача q накпн кпг се наведе квалитет кап цифра из интервала 0 9, где 0 пдгпвара највишем, а 9 најнижем квалитету). Дпдаваое буке Апликација Wavfilt пмпгућава дпдаваое буке из насумичнп изабраних аудип датптека кпје се налазе у директпријуму кпји се наведи накпн прекидача -N, а вреднпст кпличника сигнал шум се специфицира ппмпћу прекидача -S. Општи пблик ппзива је: wavfilt N <n_dir>,s<v1> -seed <v2> <i_dir> <o_dir> где је <n_dir> назив директпријума у кпме се налазе датптеке кпје садрже буку, а <v1> захтевани пднпси сигнал шум, <v2> иницијална вреднпст случајнпг генератпра на пснпву кпг се врши избпр случајнпг сигнала (ппдразумеванп 0), дпк је значеое свих псталих параметара истп кап и раније. Ппзиваое екстерних апликација Апликација Wavfilt пмпгућава и пбраду аудип датптека ппмпћу алгпритама кпји су имплементирани у неким другим кпнзплним апликацијама, укпликп пне кап први улазни параметар примају име улазне датптеке, а други име излазне датптеке. У тпм случају Wavfilt пмпгућује учитаваое свих аудип датптека из задатпг улазнпг директпријума <i_dir> и оихпвп смештаое у пдгпварајуће излазне датптеке задржавају прганизаципну структуру (пп диркетпријумима) извпрних аудип датптека у излазнпм директпријуму <о_dir>. Општи пблик ппзива је: wavfilt е <арр1>@0,@1 <i_dir> <o_dir> где је <арр1> назив екстерне апликације праћен пдгпварајућим прекидачима (акп исти ппстпје), пзнаке @0 и @1 замеоују име улазне и излазне датптеке, дпк је значеое свих препсталих параметара непрпмеоенп. Препстале ппције 9
Подаци о техничком решењу: РЕЦЕНЗИЈА ТЕХНИЧКОГ РЕШЕЊА Назив техничког решења: Аутори техничког решења: Реализатори: Пројекати на којим је развијено: Област на коју се односи: Корисници: Категорија техничког решења: Wavfilt апликација за модификовање аудио датотека Едвин Пакоци, Наташа Вујновић Седлар, Стеван Острогонац, Роберт Мак Факултет техничких наука и АлфаНум у Новом Саду Развој дијалошких система за српски и друге јужнословенске језике, ТР32035 код МПНТР (2011 2015) Електроника, телекомуникације и информационе технологије Предузеће АлфаНум у Новом Саду, од 2015. године Ново техничко решење прототип (M85) Подаци о рецензенту: Име, презиме и звање: Ужа научна област за коју је изабран у звање, датум избора у звање и назив факултета: Установа где је запослен: Др Александар Родић, ванредни професор Изабран у звање ванредни професор (2012) на Електротехничком факултету Универзитета у Београду за у.н.о. Аутоматско управљање, сигнали и системи Инситут Михајло Пупин, Београд Стручно мишљење рецензента: Резултат научно истраживачког рада Wavfilt апликација за модификовање аудио датотека представља ново техничко решење прототип (М85) у смислу Правилника о поступку и начину вредновања, и квантитативном исказивању научноистраживачких резултата истраживача од 21.03.2008. Образложење за техничко решење (ТР): Техничко решење омогућава обраду аудио датотека која обухвата: промену брзине, темпа, висине и боје звука, симулацију процеса кодовања аудио и говорних сигнала као и вештачко додавање буке. Ово техничко решење омогућава проширење базе за обуку система за аутоматско препознавање говора уз минималне додатне трошкове. ТР представља апликацију која на основу задатих улазних параметара модификује сигнале из улазних датотека, а резултате смешта у излазне датотеке, очувавајући организациону структуру по директоријумима која постоји код изворних датотека. ТР представља нови производ заснован на јавно доступним и отвореним библиотекама.. ТР се примењује у предузећу АлфаНум и на Факултету техничких наука у Новом Саду. У Београду, 26.11.2015. године. Др Александар Родић
Подаци о техничком решењу: РЕЦЕНЗИЈА ТЕХНИЧКОГ РЕШЕЊА Назив техничког решења: Аутори техничког решења: Реализатори: Пројекати на којим је развијено: Област на коју се односи: Корисници: Категорија техничког решења: Wavfilt апликација за модификовање аудио датотека Едвин Пакоци, Наташа Вујновић Седлар, Стеван Острогонац, Роберт Мак Факултет техничких наука и АлфаНум у Новом Саду Развој дијалошких система за српски и друге јужнословенске језике, ТР32035 код МПНТР (2011-2015) Електроника, телекомуникације и информационе технологије Предузеће АлфаНум у Новом Саду, од 2015. године Ново техничко решење прототип (M85) Подаци о рецензенту: Име, презиме и звање: Ужа научна област за коју је изабран у звање, датум избора у звање и назив факултета: Установа где је запослен: Mр Дејан Тодоровић Није биран у наставна и научна звања, али је активан члан АЕС-а и суорганизатор конференције ТАКТОНС. Dirigent Acoustics, Београд Стручно мишљење рецензента: Резултат научно-истраживачког рада Wavfilt апликација за модификовање аудио датотека представља ново техничко решење прототип (М85) у смислу Правилника о поступку и начину вредновања, и квантитативном исказивању научноистраживачких резултата истраживача од 21.03.2008. Образложење за техничко решење (ТР): Техничко решење модификовањем брзине изговора, висине и боје гласа, симулацијом кодовања говорног и аудио сигнала, као и додавањем буке омогућава вештачко проширење говорне базе уз минималну људску интервенцију и додатне трошкове. Ово ТР се може користити и за различите аудио ефекте. ТР се користи преко командне линије оперативног система, а резултат су аудио датотеке са истом организационом структуром као и изворе а које садрже модификоване сигнале у зависности од прослеђених улазних параметара. ТР представља нови производ заснован на јавно доступним и отвореним библиотекама. ТР се примењује у предузећу АлфаНум и на Факултету техничких наука у Новом Саду. У Београду, 26.11.2015. године. Mр Дејан Тодоровић
AlfaNum d.o.o., Novi Sad Trg Dositeja Obradovica 6 02114750204 PIB: 102948614 Mat.br. 08790949 Tekuci racun: 335-6188-21 Registarski broj: 002890219 Sifra delatnosti: 72400 U Novom Sadu, 22.11.2015. POTVRDA Ovim potvrdujemo da je 01.07.2015. godine u preduzecu AlfaNum d.o.o. pocelo da se koristi tehnicko resenje Wavfilt - aplikacija za modifikovanje audio datoteka, koje je razvijeno od strane Fakulteta tehnickih nauka Novi Sad i preduzeca AlfaNum, a koristi se za potrebe pripreme govornih baza podataka za razne namene, internog testiranja i daljeg razvoja resenja. Resenje je inicijalno instalirano za interne potrebe i testiranja, ali ga preduzece AlfaNum koristi i za promovisanje govornih tehnologija za srpski jezik. U ime firme: Direktor Darko Pekar, dipl. ing. Darko Pek