Aquesta tesi tracta de cercadors d'audio basats en contingut. Especificament, tracta de desenvolupar tecnologies que permetin fer mes estret l'interval semantic o ``semantic gap' que, a avui dia, limita l'us massiu de motors de cerca basats en contingut. Els motors de cerca d'audio fan servir metadades, en la gran majoria generada per editors, per a gestionar col.leccions d'audio. Tot i ser una tasca ardua i procliu a errors, l'anotacio manual es la practica mes habitual. Els metodes basats en contingut audio, es a dir, aquells algorismes que extreuen automaticament etiquetes descriptives de fitxers d'audio, no son generalment suficientment madurs per a permetre una interaccio semantica. En la gran majoria, els metodes basats en contingut treballen amb descriptors de baix nivell, mentre que els descriptors d'alt nivell estan mes enlla de les possibilitats actuals. En la tesi explorem metodes, que considerem pas previs per a atacar linterval semantic.
Wei SunZhe‐Ming LuFaxin YuShen Rong-jun
Wei SunZhe‐Ming LuFaxin YuShen Rong-jun
Jianhua ShiHuanhuan LiuXiaoqing YuWei Xiong
Erling WoldThom BlumDouglas KeislarJ. Wheaten
Erling WoldThom BlumDouglas KeislarJames WheatonMuscle Fish