|
" Hay la misma diferencia entre un sabio y un ignorante que entre un hombre vivo y un cadáver " - Aristóteles - ![]() |
Computerfacil.com |
Chat
Fotos
Últimos Posts
Ayuda
Búsqueda
Miembros
Calendario
|
| Bienvenido, invitado ( Identificarse | Registrarse ) | Reenviar mensaje de validación |
|
|
Forista del Mes: amateos1404
|
![]() ![]() ![]() |
| maik |
Publicado: Apr 24 2007, 11:49 PM
|
||
![]() * The Founder * Grupo: Administradores Mensajes: 4.880 Miembro nº: 2 Registrado: 23-August 04 |
Factores en la reordenación de los resultados de búsqueda
Los buscadores intentan que las palabras usadas en las búsquedas coincidan con las palabras encontradas en las páginas y en los enlaces que enlazan a esas páginas. Con frecuencia, el orden en que se presentan los resultados se basa en la indización del texto de esas páginas, texto en los enlaces a esas páginas y una medición de la importancia basada en la popularidad de enlaces. Sin embargo, antes de que los resultados sean entregados al usuario, puede pasar que se haga un reordenamiento por una razón u otra. Aquí tenemos algunas de las posibilidades: Eliminación de contenidos duplicados, o casi duplicados Los buscadores no quieren que sus resultados contengan páginas o contenidos duplicados, por lo que aquellas páginas que sean sustancialmente similares pueden ser filtradas. Si bien, técnicamente, no se trata de el reordenamiento de resultados, como el Dr. García indica observa en “Search Engine Patents On Duplicated Content and Re-Ranking Methods” (http://www.miislita.com/search-engine-conferences/duplicated-content-patents.html ), este tipo de filtrado tiene como resultado la alteración del orden en que el usuario percibe los resultados de búsqueda. Eliminación de múltiples páginas relevantes de un mismo sitio Es poco común que no haya más de una página de un mismo sitio relevante para una búsqueda. Los buscadores intentan limitar el número de páginas mostradas de un mismo sitio en los resultados. De haber más de una página relevante de un mismo sitio, el buscador mostrará un segundo resultado de ese sitio, inmediatamente a continuación del primero e insertará un enlace a “más resultados de este sitio”. Puede que no se muestren resultados adicionales. Basados en intereses personales Los buscadores pueden intentar reordenar los resultados de una búsqueda basándose en búsquedas anteriores del usuario u otra información que hayan sido monitoreadas. Este tipo de re-ordenamiento puede producirse cuando un usuario se registra para recibir búsquedas personalizadas. Se presentan algunas maneras en que esto puede suceder: * Búsqueda personalizada mediante el análisis automatizado de intereses y actividades (http://haystack.lcs.mit.edu/papers/teevan.sigir05.pdf) (pdf) * Personalización variable de los resultados de búsqueda en un buscador (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20050216434".PGNR.&OS=DN/20050216434&RS=DN/20050216434) * Personalización de web search (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.html&r=1&f=G&l=50&d=PG01&p=1&S1=20050071328&OS=20050071328&RS=20050071328) 1.2.4. Reordenamiento basado en interconectividad local El buscador puede obtener los resultados y reordenar el top N (ej. 100, 1000, etc.) de los resultados en base a como se enlazan entre si. * Reordenamiento de resultados de búsqueda dependiendo de su interconectividad local (http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=6526440.PN.&OS=PN/6526440&RS=PN/6526440) Aquí se tiene una variación de dicho método: * Método para reordenar páginas hiperenlazadas utilizando análisis de contenido y conectividad. (http://patft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=6738678.PN.&OS=PN/6738678&RS=PN/6738678) Ordenando resultados según el país Es posible que un usuario quiera ver resultados que sean de un país en particular. El usuario puede elegir la preferencia del país o el sistema puede intentarlo dinámicamente según la dirección IP. El pedido de patente a continuación explora métodos para reordenar resultados según las preferencias de país. * Sistema y método para proveer de resultados según país de preferencia (http://patft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=6738678.PN.&OS=PN/6738678&RS=PN/6738678) Ordenando según el idioma Las preferencias de lenguaje pueden ser establecidas por el usuario en el browser o en el buscador, al momento de buscar, en la interfaz y las características de la búsqueda. Aquí se puede ver como los resultados pueden ser modificados si se identifica la preferencia del idioma: * Sistema y método para proveer de resultados según la preferencia del idioma (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20040194099".PGNR.&OS=DN/20040194099&RS=DN/20040194099) Viendo la segmentación de población y audiencia Este método puede observar cosas como la ubicación, otras informaciones demográficas e información de grupos a los cuales el usuario esta asociado, como ayuda para reordenar resultados. Técnicamente, esto puede no ser considerado reordenamiento, ya que no se modifica el conjunto original de resultados, pero si hay un conjunto de resultados que son alterados según las diferencias en la población. * Métodos y sistemas para mejorar resultados de búsqueda utilizando información demográfica. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20050060310".PGNR.&OS=DN/20050060310&RS=DN/20050060310) Reordenamiento según datos históricos Las páginas pueden ser reordenadas al incluir información como la antigüedad de un documento, de los enlaces a esos documentos y datos históricos que se relacionan con el factor temporal. Este pedido de patentes de google contiene una larga lista de factores: * Recuperación de información según datos históricos (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20050071741".PGNR.&OS=DN/20050071741&RS=DN/20050071741) Reordenamiento según “topic familiarity” Una patente de Yahoo! describe como observar cosas como niveles de lectura, uso de “stop words” y otro tipo de funcionalidades textuales. La patente permite que los usuarios utilicen una interfaz para escoger entre resultados que son introductorios y otros que son de nivel avanzado: * Sistema y método para influir resultados según la familiaridad con el tema 1.2.10. Reordenando según la intención comercial Similar al método descrito más arriba, mediante el uso de un dial, Yahoo! Mindset (http://mindset.research.yahoo.com/) permite que los usuarios decidan si quieren ordenar los resultados según su intención: resultados comerciales o resultados de naturaleza informativa. Reordenamiento y eliminación de resultados según compatibilidad con dispositivos móviles Microsoft provee de una manera para mostrar páginas que se muestran bien en dispositivos móviles y para desestimar aquellas que no son compatibles: * Mobile friendly internet searches (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20060212451".PGNR.&OS=DN/20060212451&RS=DN/20060212451) Reordenamiento según accesibilidad Google ha lanzado recientemente un buscador especializado que reordena los resultados según el grado de accesibilidad con su Accessible Web Search (http://labs.google.com/accessible/) para personas con discapacidad visual. Reordenamiento según contenido editorial Una patente otorgada a Google describe el reordenamiento de resultados según si las páginas han sido definidas como favorecidas o no-favorecidas. * Sistema y método que permite opinión editorial en el ordenamiento de los resultados de búsqueda. (http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=7096214.PN.&OS=PN/7096214&RS=PN/7096214) Reordenamiento según términos adicionales (boosting) y comparación de similitud de textos Este documento de Google/Berkeley describe el reordenamiento de resultados para una búsqueda de noticias, considerando y agregando palabras de búsqueda adicionales y teniendo en cuenta la similitud de los documentos. * Query-Free News Search (http://www2003.org/cdrom/papers/refereed/p707/p707-henzinger.html) 1.2.15. Reordenamiento según feedback implícito de la actividad del usuario y ratio de clicks Hay muchos “papers” y pedidos de patente que describen el reordenamiento de resultados considerando el comportamiento del usuario y la selección de palabras. Aquí tenemos uno que observa queries diferentes durante una misma sesión de búsqueda: * Query Chains: Learning to Rank from Implicit Feedback (http://www.cs.cornell.edu/~filip/papers/Radlinski05QueryChains.pdf) (pdf) Reordenamiento según endorso de la comunidad Un número de documentos hace referencia al uso de coleccionar información de un gran número de usuarios de redes sociales. Aquí unos ejemplos: * Método computacional y aparato para búsquedas web colaborativas. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20060136377".PGNR.&OS=DN/20060136377&RS=DN/20060136377) * Sistema de búsqueda y métodos con integración de anotación de usuarios agregada. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20050256867".PGNR.&OS=DN/20050256867&RS=DN/20050256867) * Sistema de búsqueda y métodos con integración de anotaciones de usuarios de una trust network. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.html&r=14&p=1&f=G&l=50&d=PG01&S1=reranking.BIS.&OS=spec/reranking&RS=SPEC/reranking) * Métodos y sistemas para endorsar resultados de búsqueda locales. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20060004713".PGNR.&OS=DN/20060004713&RS=DN/20060004713) Reordenamiento basado en información redundante La probabilidad de distribución de palabras de un número de resultados para intentar identificar tópicos que pueden ser abarcados por una búsqueda y que puede ser usado para mostrar un set de resultados basados en dichas categorías. * Uso de información redundante para mejorar búsquedas textuales. (http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PALL&p=1&u=/netahtml/PTO/srchnum.htm&r=1&f=G&l=50&s1=7,051,014.PN.&OS=PN/7,051,014&RS=PN/7,051,014) Reordenamiento basado en “storylines” Este documento de IBM explica como reorganizar resultados en “storylines” que se expanden de diferentes maneras y filtra otras, antes de presentarle al usuario. Sistema que identifica storylines que emergen de resultados de búsqueda bien posicionados. (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml ) Reordenamiento observando blogs, noticias y páginas como enfermedades infecciosas Se utiliza la analogía de la propagación de epidemias como modelo de un pedido de patente de IBM que describe como segmentar temas, prestando atención a los cambios a lo largo del tiempo y la adición de esos temas en la blogosfera y foros. Este método podría indicarle al buscador que temas y palabras son populares y donde se puede ubicar dicha información. Si bien el proceso esta descrito en el contexto de alertas de noticias, el concepto podría expandirse para ayudar al reordenamiento de resultados según popularidad. * System, method, and service for segmenting a topic into chatter and subtopics (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20050246321".PGNR.&OS=DN/20050246321&RS=DN/20050246321) Reordenamiento según información conceptual relacionada, incluyendo factores basados en tiempo y uso El pedido de patente a continuación, describe un proceso similar a los dos anteriores. Incluye la agrupación de conceptos y la observación de como cambian a lo largo del tiempo cuando las personas participan en esos cambios. Uno de los inventores es Apostolos Gerasoulis de Ask. * Methods and systems for providing a response to a query (http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=/netahtml/PTO/srchnum.html&r=1&f=G&l=50&s1="20060230040".PGNR.&OS=DN/20060230040&RS=DN/20060230040) Por tanto, los resultados que se ven para una búsqueda no siempre serán los que otra gente vea. Si bien esto no pretende ser una lista completa de todos los documentos que describen formas en que un buscador puede reordenar resultados, si cubre una variedad de posibilidades. Algunos de estos procesos están implementados y en uso, otros podrían ser usados en el futuro, y otros quizá nunca. Pero es bastante probable que algunos de los procesos sean lanzados en el futuro cercado por alguno de los buscadores. Para algunos de estos métodos de reordenamiento, puede ser que sea posible asegurarse un buen posicionamiento, a pesar de que no todos los usuarios vean los mismos resultados. [SLAWSKI06] -------------------- Si te sirvió de ayuda el Foro, ayúdanos a crecer poniendo este enlace en tu web: Foro de Informatica
Gracias!
|
||
![]() |
![]() ![]() ![]() |
|
|
|