TheHarvester es una herramienta muy usada en el ámbito del OSINT (Open Source INTelligence, o Inteligencia de Fuentes Abiertas en español) y en las fases de reconocimiento de cualquier prueba de penetración o pentesting.
Índice
Instalación de theHarvester
Esta herramienta tan útil se encuentra por defecto instalada en las distribuciones de Kali Linux, pero si tienes otro sistema operativo Linux, puedes instalarla de igual forma desde su GitHub.
Aquí tienes el proceso de instalación más sencillo, a mi parecer:
- Asegúrate de tener instalado Python 3.7 o superior y tener pip en una versión 20.3 o superior
- El primer paso es clonar el repositorio. Para ello usaremos el comando
git clone https://github.com/laramies/theHarvester
- Acto seguido accederemos a la carpeta de theHarvester recién creada al clonar el repositorio:
cd theHarvester
- En caso de querer desarrollar módulos para la herramienta, hemos de instalar los requerimientos correspondientes:
python3 -m pip install -r requirements/dev.txt
- Si nuestra intención es hacer un uso sencillo de la herramienta, instalaremos los requerimientos básicos:
python3 -m pip install -r requirements/base.txt
- Para terminar, ejecutaremos la herramienta con el siguiente comando, que además nos mostrará la ayuda con todas las flags y opciones de la herramienta:
python3 theHarvester.py -h
La ayuda de theHarvester
Cuando accedamos a theHarvester, lo primero que encontraremos es el banner de la herramienta:

Si hemos seguido los pasos del apartado de instalación, nos aparecerá la ayuda en inglés. A continuación, de todos modos, os pongo todas las opciones en español, para aquellos que no tengáis buen nivel de inglés o que, sencillamente, no tengáis ganas de traducir:
- -h, –help: Abre el menú de ayuda de la herramienta.
- -d DOMINIO, –domain DOMINIO: Nombre o dominio de la empresa a buscar.
- -l LÍMITE, –limit LÍMITE: Limita la cantidad de resultados de la búsqueda, por defecto el límite está en 500 resultados.
- -S COMIENZO, –start COMIENZO: Empieza por el resultado número X, por defecto X=0.
- -g, –google-dork: Usar Dorks de Google para realizar la búsqueda.
- -p, –proxies: Usa proxies para las peticiones, incluir los proxies en el archivo proxies.yaml.
- -s, –shodan: Usa Shodan para consultar los hosts descubiertos.
- –screenshot CAPTURA: Toma capturas de pantalla de los dominios resueltos, hay que indicarle el directorio de almacenamiento para las capturas.
- -v, –virtual-host: Verifica el nombre del host a través de la resolución DNS y busca máquinas virtuales en el host correspondiente.
- -e SERVIDOR_DNS, –dns-server SERVIDOR_DNS: Servidor DNS en el que realizar la búsqueda.
- -t DNS_TLD, –dns-tld DNS_TLD: Realiza un descubrimiento de expansión de TLD de DNS, por defecto falso.
- -r, –take-over: Busca adquisiciones.
- -n, –dns-lookup: Habilita la búsqueda de servidores DNS, por defecto falso.
- -c, –dns-brute: Realiza una fuerza bruta de DNS en el dominio.
- -f NOMBRE_ARCHIVO, –filename NOMBRE_ARCHIVO: Guarda los resultados en formato XML y JSON.
- -b FUENTE, –source FUENTE: Permite seleccionar como fuente entre muchos motores de búsqueda. Si le indicamos la opción «all» realiza la búsqueda en todos los motores disponibles.
Buscando con theHarvester
He realizado una búsqueda de prueba para que podáis realizarla si seguís este tutorial, para comparar si los resultados que os da son los mismos que a mí.
La búsqueda la he hecho con el siguiente comando:
theHarvester -d microsoft -s -b all
Con este comando, he conseguido muchísimos resultados, por lo que pegar aquí todos sería algo inviable, pero sí os daré las cifras, para que más o menos os hagáis una idea:
- ASNS encontrados: 4
- URLs interesantes encontradas: 37
- No se encontraron usuarios de Twitter, LinkedIn ni URLs de Trello
- IPs encontradas: 35
- Correos electrónicos encontrados: 3
- Hosts encontrados: 14178
- No se encontró nada en Shodan debido a que falta la API key
Conclusiones
Cómo podéis ver, theHarvester es una herramienta muy útil a la hora de buscar información de forma pasiva. También cabe destacar que, cuantas más API keys tengamos, más información encontrará. Eso ya depende de cada uno de vosotros.
Tutorial muy completo y bien explicado con sus correspondientes ejemplos y comentarios aplicando todos los comandos para ser instalado en Python.
theHarvester una herramienta muy interesante y muy potente en la búsqueda de fuentes abiertas.
Muchas gracias por tu comentario manuel. Tengo pensado crear más tutoriales parecidos a este, y ver que a la gente le gustan anima más a ello.