¿Qué son los bad bots, cómo detectarlos y bloquearlos?

Bots, Feb-01-20225 minutos de lectura

¿Te viene algo bueno a la cabeza cuando oyes la palabra bots o sabes cómo detectar y bloquear los bots malos? Supongo que todo lo que has oído hablar es de bots malos y mucho menos de cómo detectarlos y bloquearlos. Sin embargo, no todos los bots son malos y los hay buenos. Este artículo

¿Te viene algo bueno a la cabeza cuando oyes la palabra bots o sabes cómo detectar y bloquear los bots malos? Supongo que todo lo que has oído es sobre bots malos y mucho menos sobre cómo detectarlos y bloquearlos.

Sin embargo, no todos los bots son malos, y los hay buenos. Este artículo trata de los bots malos, de cómo distinguir los buenos de los malos y del daño que pueden causar a su sitio web. Por último, pero no por ello menos importante, descubrirás cómo puedes prevenir las consecuencias de los bots malos.

En primer lugar, veamos qué son los bots en términos no especializados.

¿Qué son los robots de Internet?

Según un informe reciente de la empresa de ciberseguridad Barracuda, dos tercios del tráfico de Internet (64%) está formado por bots. De estos dos tercios de bots, el 40% del tráfico de Internet lo constituyen bots malos. Estas estadísticas corresponden a septiembre de 2021.

Además, este informe señala que si no aplicamos medidas de seguridad estrictas, estos bots traspasarán las defensas y robarán datos, lo que provocará un bajo rendimiento del sitio y violaciones de datos.

Veamos algunas de las tareas cotidianas que realiza un bot.

Ejemplos típicos de bots

Un ejemplo cotidiano de funcionamiento de un bot sería el de motores de búsqueda como Google que emplean bots para rastrear miles de páginas web y extraer contenidos para indexarlos. Luego, cuando se busca una frase en Google, éste sabe dónde está disponible la información deseada.

Del mismo modo, los bots transaccionales completan transacciones en nombre de humanos, y los bots de venta de entradas compran entradas para eventos populares.

Además, desde el desarrollo de la IA (Inteligencia Artificial) y el aprendizaje automático, los servicios de inteligencia empresarial han utilizado bots para rastrear páginas de productos y testimonios de perfiles de redes sociales para descubrir cómo está funcionando un producto. 

Una razón importante de la preferencia de los robots sobre los humanos en algunas de las tareas anteriores es que podrían ejecutar instrucciones cientos o miles de veces más rápido que los humanos.

Averigüemos ahora la diferencia entre los bots buenos y los de banda.

¿Cuáles son los distintos tipos de bots?

Como he mencionado anteriormente, los bots se pueden clasificar en buenos y malos. Como con todo lo demás, echemos un vistazo primero a los bots buenos.

Buenos robots

Acabamos de ver un ejemplo de un buen bot, un bot de motor de búsqueda. Del mismo modo, hay otros buenos bots como:

  • Bots de motores de voz: Al igual que los robots de los motores de búsqueda, estos robots rastrean la web para encontrar respuestas a las consultas que los usuarios realizan mediante búsquedas por voz. Alexa's Crawler y Applebot (Siri ) son algunos de los bots de búsqueda por voz más conocidos.
  • Bots de redes sociales: Estos bots rastrean los sitios web compartidos en Facebook y otras redes sociales para mejorar las sugerencias, combatir el spam y mejorar el entorno online. Algunos de los ejemplos típicos son Facebook Crawler y Pinterest Crawler. 
  • Bots de derechos de autor: Estos bots buscan contenidos digitales para descubrir infracciones de los derechos de autor. Un buen ejemplo es el Content ID de Youtube asignado a los propietarios de derechos de autor de la red. Otro ejemplo sería el uso de estos bots en las redes sociales, donde la creación de contenidos originales es la máxima prioridad.
  • Bots de marketing: El software de SEO y marketing de contenidos utiliza principalmente estos bots para rastrear sitios web en busca de backlinks, determinar el volumen de tráfico y buscar palabras clave orgánicas y de pago. Algunos ejemplos son SEMrush bot y AhrefsBot.
  • Bots de datos: Son los bots que proporcionan información instantánea sobre noticias, el tiempo y los tipos de cambio de divisas. Algunos ejemplos destacados son Amazon Echo y Google Home. 
  • Trader Bots: Estos bots te ayudan a encontrar las mejores ofertas o promociones en productos que piensas comprar online. Los consumidores y los minoristas hacen el mejor uso de los bots comerciales para encontrar mejores ofertas de precios y superar a sus competidores.

¿Qué características tienen los buenos robots?

Como puede ver, una de las características distintivas de estos buenos bots es que realizan una tarea valiosa para una empresa o los visitantes de un sitio web. Los desarrolladores que los crearon no lo hicieron con malas intenciones.

Además, no entorpecen la experiencia del usuario del sitio web que rastrean. Un buen bot también respeta las reglas del archivo robot.txt de un sitio web, que especifica las páginas que debe rastrear y las que no.

Sin embargo, en el lado negativo, cuando los bots visitan un sitio web, pueden consumir el tiempo de carga del servidor y el ancho de banda. Por tanto, incluso los bots auténticos podrían causar daños involuntariamente. Además, un bot agresivo de un motor de búsqueda también podría tumbar un sitio. 

Dicho todo esto, puede superar estas consecuencias negativas con una configuración adecuada del servidor.

Ahora vamos a entrar en lo que son los bots malos.

Bab Bots

Al igual que los bots buenos causan algún perjuicio a los usuarios, los desarrolladores de software desarrollan bots malos para causar daño. Algunos de los bots malos en el mercado son:

Bots que inflan las páginas vistas

Los desarrolladores desarrollan estos bots para enviar tráfico falso a los sitios web con el fin de aumentar el número de páginas vistas y engañar a los propietarios de las páginas haciéndoles creer que su número total de páginas ha aumentado. Sin embargo, en realidad, no hay usuarios reales, y son los bots los que están incrementando las páginas vistas o los "me gusta". 

Algunos servicios web utilizan estos bots para vender tráfico. Afirmarán que enviarán usuarios reales a tu sitio web y, de hecho, acaban enviando tráfico de bots.

Algunos bots también ven vídeos e inflan el número de visitas.

Spam bots

Los robots de spam visitan a menudo una página web para llevar a cabo tareas de spam. Uno de los ejemplos significativos de una actividad spam es que interactúan automáticamente con formularios online, dejan comentarios y los envían haciendo clic automáticamente en el botón de envío. 

Algunos competidores de su empresa, por ejemplo, dejan comentarios falsos sobre productos para generar reseñas negativas sobre un producto. Otro ejemplo del uso frecuente de bots de spam es en las campañas políticas.

A menudo te habrás dado cuenta de que los comentarios spam contienen incluso URLs y hasta caracteres especiales.

Raspadores web

Los raspadores web son bots de Internet que facilitan el robo de su contenido. Estos bots raspadores suelen visitar páginas web y extraer datos sin el consentimiento de los administradores del sitio web.

Aunque el "scraping" en línea no es ilegal ante la ley, siempre que el contenido esté disponible abiertamente, no necesite autentificación y no esté sujeto a leyes de copyright, a los autores no les suele gustar. Los raspadores web pueden cerrar el sitio web si envían demasiadas consultas.

Bot de pago

La mayoría de la gente utiliza bots de pago cuando compra zapatillas de edición limitada. Dado que un usuario solo puede comprar un par debido a la naturaleza competitiva de las ediciones limitadas, utilizan bots de pago para agilizar el proceso de compra en línea.

Este proceso de copia de zapatillas por parte de los bots se produce a una velocidad superior a la que sólo los humanos podrían soñar. Como resultado, los que compren de verdad no tendrán ninguna posibilidad de conseguir zapatillas, ya que no pueden acercarse a la velocidad de los bots. Quizá te interese leer esto: ¿Qué son los bots de zapatillas y cómo se utilizan?

Botnets

Los botnets son redes informáticas que un hacker ha secuestrado para llevar a cabo diversos ciberataques.

Los hackers desarrollan botnets para aumentar su capacidad de llevar a cabo asaltos más extraordinarios, como ataques DDOS coordinados, mediante el crecimiento, la automatización y la aceleración del proceso. A continuación, las botnets utilizan sus dispositivos para defraudar y perturbar los dispositivos de otras personas sin su conocimiento o aprobación.

Entonces, estos dispositivos infectados se denominan dispositivos Zoombie. Para más información sobre botnets, puede consultar este artículo.

Robots de adquisición de cuentas

Estos bots suelen robar credenciales de inicio de sesión empleando dos de los métodos automatizados más comunes, conocidos como Credential Stuffing y Credential Cracking. El primer método utiliza intentos de inicio de sesión masivos para verificar la validez de un par de nombre de usuario y contraseña que han robado.

En cambio, el último método incluye bots que intentan diferentes valores para el par de nombre de usuario y contraseña. Entonces, los bots acaban teniendo éxito e irrumpen en un sistema informático que podría tener consecuencias de gran alcance.

Bots de cardado y craqueo de tarjetas

Como habrá adivinado, el fraude con tarjetas de crédito puede producirse en cualquier sitio web que utilice un procesador de pagos. Los hackers utilizan bots maliciosos para verificar los números de tarjetas de crédito que robaron realizando pagos menores conocidos como Carding. 

También utilizarían el cracking de tarjetas para identificar la información que falta, como fechas de caducidad y números CVV.

Estas amenazas afectan con frecuencia a los sectores del comercio minorista, el ocio y los viajes.   

Cómo detectar bots malintencionados

La detección y gestión de bots requiere mucha investigación y experiencia, ya que los hackers diseñan los bots para que sean invisibles. Hay que investigar a fondo para averiguar si su sitio tiene tráfico de bots. Por otra parte, es necesario reducir al mínimo los falsos positivos (los humanos se confunden con los bots) y los falsos negativos (cuando se identifica erróneamente a los humanos con bots malos).

En cualquier caso, aquí tienes algunos indicios de que los bots pueden haberse infiltrado en tu sistema:

Aumento irregular de su tráfico

Cualquier propietario de un sitio web tendrá acceso a los datos de las métricas del sitio. Por ejemplo, los datos de Google Analytics. Así que cuando usted ve esas métricas, si te das cuenta de que hay un aumento drástico en el tráfico desde lugares inusuales, indica que los robots están interactuando con su sitio.

En tales circunstancias, es posible que note un mayor aumento de la tasa de rebote. Es posible que los lugares de los que recibe este tráfico procedan de lugares de los que no suele recibir visitas.

Inspeccionando la cabecera de la solicitud

En la mayoría de las situaciones, algunos de los bots menos sofisticados no envían todas las cabeceras que suele enviar un navegador. De hecho, se olvidan de enviar la cabecera user-agent.

Los bots sofisticados que suelen enviar cabeceras no envían más que la cadena user-agent. Así que si recibes peticiones con pocos o ningún título, indica que los bots están evaluando potencialmente tu sitio web. Por el contrario, los navegadores envían un número razonable de información de cabecera.

El rendimiento del servidor se ralentiza considerablemente

Como ha aprendido anteriormente, cuando los bots acceden a su sitio web, consumen la mayor parte de los recursos de su sitio web, incluido el ancho de banda. Así que si recibes montones de peticiones de bots en un corto espacio de tiempo, esto implica que tu sitio web será considerablemente más lento.

Sin embargo, algunos de los astutos bots actúan de forma que pasan desapercibidos y llevan a cabo sus actividades de forma similar a un humano. Enviarían muy pocas solicitudes como haría un humano en el proceso.

Así que no siempre se puede confiar en la ralentización del rendimiento como métrica para medir el tráfico de bots.

Duración alta o baja de las sesiones

Normalmente, la duración de la sesión o la cantidad de tiempo que un usuario pasa en un sitio web es constante. Pero, un aumento repentino en el transcurso de las sesiones implicaría que los bots están navegando por su sitio web a un ritmo menor. Por otra parte, los bots pueden estar haciendo clic a través de las páginas del sitio más rápido que un usuario humano, lo que resulta en una disminución espontánea del tiempo de sesión.

Conversiones basura y publicación de contenidos

Es posible que reciba formularios de direcciones de correo electrónico, números de teléfono y nombres falsos.

Otra forma de detectar fácilmente a los bots es el contenido que publican. A diferencia de los humanos, los bots no tienen tiempo para crear contenido de calidad. Así que cuando empieces a recibir comentarios vagos y tontos o publicaciones con URL incrustadas, tienes que reconocer que no son de personas reales, sino de bots.

Cómo bloquear bots malintencionados

Como paso inicial para combatir estos bots malos, debe configurar el archivo robot.txt de su sitio. Sin duda, puedes configurar este archivo para controlar a qué páginas podría acceder el bot y minimizar las interacciones del bot con la mayoría de las páginas de tu sitio web.

Otras medidas son:

Establecer límites de tasa basados en la dirección IP- La dirección IP es un identificador único del dispositivo que evalúa su sitio web. Así que, como administrador web, podrías limitar el número de peticiones que una dirección IP hace a tu sitio en un periodo de tiempo determinado.

Bloqueo de direcciones IP sospechosas - Además de establecer los límites de velocidad, sus direcciones web pueden bloquear la lista de direcciones IP sospechosas desde las que se originan las peticiones. Para ello, puede utilizar un WAF (Web Application Firewall).

Utiliza servicios captcha - Es posible que te hayas encontrado con captchas al acceder a algunos sitios web. Cuando un servicio de captchas detecta un comportamiento extraño o similar al de un bot, te hace resolver un problema antes de que te den permiso para acceder al sitio.

Conclusión

Esperamos que haya adquirido una visión general de los bots malos, cómo detectarlos y, finalmente, deshacerse de ellos. De hecho, necesitarás algunos bots auténticos que no causen ningún daño a tu sistema. Sin embargo, sería de gran ayuda que desalojaras a los bots malos a toda costa, ya que el daño que podrían causar es muy grave.

Esperamos que este artículo le haya resultado útil. Esté atento a los próximos artículos.