Unha busca ou consulta nos motores coma Google, Yahoo, Bing, et atl. é un modo de recuperar información (IR). Recuperar material que satisfaga unha necesidade de información se traduce en atopar material que sexa o máis parecido posible aos términos clave indicados na consulta.
A organización automática (clustering), a resposta de preguntas (question answering) e a elaboración de resumes (summarization) son as estratexias básicas do funcionamento dos coñecidos buscadores de contidos que se usan en Internet.
As necesidades de información dos usuarios -consultas- e os documentos cos que se alimenta o sistema - obxectos indexados- son os elementos clave para calquera sistema de IR:
coa comparación das consultas cos obxectos indexados se obteñen os obxectos recuperados que se lle presentarán ao usuario.
A 'mellora' dos resultados para obter aqueles que se axusten mellor ás necesidades do usuario son o obxecto da implementación de novos recursos -algoritmos- por parte dos buscadores. Esta mellora se retroalimenta e aproveita tanto o poder de computación dos chamados motores de busca como a interacción proposta de xeito manual polos usuarios cando, p.ex. `perfeccionamos' ou acoutamos os resultados dunha busca con outra; ou, tamén coa supervisión ou valoración automatizada dos motores sobre a selección de obxectos entre os resultados que se presentan.
Basicamente existen tres modelos de IR: o modelo booleano, o modelo probabilístico e o modelo vectorial. Todos eles representan, tanto os documentos como as consultas, mediante un conxunto de términos clave (keywords) que se emplean como términos de indexación. A principal diferencia entre eles reside na forma de representar ditos términos e a forma de relacionalos.
A estes métodos básicos hai que engadir o concepto de relevancia. E aqui os diferentes programadores dos algoritmos e tecnoloxías implicadas optan por solucións diversas - de ai as diferenzas de resultados dos diferentes buscadores-. Asemade é este concepto de relevancia o que permite diferenciar entre información recuperada de xeito orgánico e información que ten que ser recuperada por patrocinio mercantil, interese sociolóxico, condicionantes políticos, e outros.


Máis info:
http://www.google.com/intl/es-419/insidesearch/
https://help.yahoo.com/kb/search
Comentarios
Publicar un comentario