Algoritmos
Filtran el código fuente de Yandex, el principal buscador en Rusia, y revelan sus factores de posicionamiento
Yandex ha asegurado que el autor del robo de datos es un exempleado y la filtración, “política”
Uno de los pocos sitios en los que Google no es el buscador dominante es Rusia. Allí, Yandex ocupa más del 50% del mercado de forma sostenida desde hace años y es, junto a la pléyade se servicios de la compañía, una herramienta fundamental en el ciberespacio ruso. El pasado mes de julio su código fuente fue robado y seis meses después ha sido filtrado en Internet. Además de las implicaciones que tiene para la seguridad de los productos de Yandex y que habrá de verse con el tiempo, los primeros análisis de los más de 44 gigas de información filtrados revelan los factores de posicionamiento que emplea el cuarto buscador del mundo.
El archivo Torrent Yandex Git Sources comenzó a distribuirse en Internet el pasado 25 de enero y su contenido abarca desde febrero de 2022, coincidiendo con el inicio de la invasión rusa, hasta el mes en el que se produjo el robo. La compañía ha declarado al medio Bleeping Computer que no ha sido hackeada y que la filtración proviene de un antiguo empleado. Su intención sería “política”, dado que no ha intentado vender el código a la competencia de Yandex.
La compañía también ha asegurado que no se han filtrado datos de usuarios, pero los riesgos de seguridad son evidentes. Además del código del buscador, también se encuentra el de otros productos de la compañía como Yandex Maps, el asistente IA Alice, Yandex Taxi, Yandex Mail, Yandex Direct (plataforma de anuncios), Yandex Disk (almacenamiento en la nube), Yandex Market, Yandex Travel (plataforma de reservas y compras de viajes), Yandex360 (espacio de trabajo), Yandex Cloud, Yandex Pay (procesamiento de pagos) y Yandex Metrika (análisis de Internet).
“Yandex no fue pirateado. Nuestro servicio de seguridad encontró fragmentos de código de un repositorio interno de dominio público, pero el contenido difiere de la versión actual del repositorio utilizado en los servicios de Yandex”, ha señalado la compañía. “Estamos realizando una investigación interna sobre los motivos de la publicación de fragmentos de código fuente al público, pero no vemos ninguna amenaza para los datos de los usuarios o el rendimiento de la plataforma”, añade Yandex.
Sin embargo, Grigory Bakunov, quien trabajó en el gigante tecnológico entre 2002 y 2019 señala al medio que el código filtrado tiene el potencias de identificar brechas de seguridad y crear exploits dirigidos.
Los 1.992 factores de posicionamiento de Yandex
Los buscadores mueven buena parte de la actividad de los usuarios en Internet y poder conocer cómo funciona uno que emplean millones de personas es algo inédito. Los primeros análisis sobre la filtración de Yandex han llevado a investigar cuales son los factores de posicionamiento que emplea su buscador, un servicio en el que han trabajado muchos ex empleados de Google y que, por lógica, debe tener unas cuantas cosas en común con su buscador.
En el código se han identificado 1.992 factores de posicionamiento que emplea Yandex para organizar los resultados de las búsquedas que realizan los usuarios. Según explica el consultor SEO Alex Buraks tras analizar el código, el buscador favorece a las webs que cumplen condiciones como no ser demasiado antiguas, tener más tráfico orgánico que conseguido a través de buscadores, incluir pocos números y barras inclinadas en la URL, tener un código optimizado, estén albergadas en servidores fiables, enlazadas por la Wikipedia y contener palabras clave, hasta tres, en su URL, entre muchos otros factores.
You probably heard about Yandex, it’s the 4th biggest search engine by market share worldwide. Yesterday proprietary source code of Yandex was leaked.
— Alex Buraks (@alex_buraks) January 27, 2023
The most interesting part for SEO community is: the list of all 1922 ranking factors used in the search algorithm
[🧵THREAD] pic.twitter.com/6x82AAmbON
Hay que señalar que muchos de los factores de la lista contienen la etiqueta TG_DEPRECATED que indica que ya no está en uso y TG_UNUSED que señala que no se ha llegado a aplicar. En total, 1.000 del primer grupo y 200 del segundo.
No es la primera vez que Yandex es objeto del robo de su código. En 2015, otro antiguo empleado de la compañía trató de venderlo en el mercado negro por solo 28.000 dólares, según recoge Ars Technica. Fue detenido y sentenciado a dos años de prisión sin que el código llegara a trascender.
✕
Accede a tu cuenta para comentar