facebook-scraper

Qué es

facebook-scraper es una librería de Python creada por Kevin Zúñiga (kevinzg) que permite extraer datos de páginas, perfiles y grupos públicos de Facebook sin necesitar una clave de API ni la API oficial de Meta. Se apoya en peticiones HTTP (requests) y en el parseo del HTML con BeautifulSoup, e incluye una pequeña CLI además de su uso como librería. Está inspirada en el proyecto twitter-scraper y se distribuye con licencia MIT.

Para qué sirve

Recoger publicaciones de páginas públicas con su texto, imágenes, vídeos y métricas de interacción.
Extraer comentarios, respuestas y reacciones (like, love, haha, wow, etc.) de las publicaciones.
Obtener información del apartado “about” de perfiles y datos de grupos públicos.
Automatizar la monitorización de contenido público sin depender de tokens de la Graph API.

Cuándo usarlo

Útil en prototipos, investigación o análisis de datos cuando necesitas contenido público de Facebook y no quieres (o no puedes) pasar por la Graph API oficial. Para proyectos serios o de producción conviene valorar la API oficial de Meta o servicios de scraping gestionados, ya que el scraping del HTML es frágil y puede dejar de funcionar cuando Facebook cambia su web.

Ejemplo

Instalación desde PyPI:

pip install facebook-scraper

Uso básico como librería:

from facebook_scraper import get_posts

for post in get_posts("nintendo", pages=1):
    print(post["text"][:50])

También puede usarse desde la línea de comandos:

facebook-scraper --filename nintendo_posts.csv --pages 10 nintendo

Puntos clave

No requiere clave de API ni la Graph API de Meta: trabaja sobre el HTML público.
Disponible tanto como librería de Python como en forma de CLI, con exportación a CSV/JSON.
Permite acceso a contenido más completo (comentarios, reacciones) usando cookies de sesión.

Ten en cuenta

El último lanzamiento publicado (v0.2.59) es de agosto de 2022 y el desarrollo de nuevas versiones está prácticamente detenido, aunque el repositorio no está archivado y sigue habiendo actividad en issues y discusiones. Al basarse en el HTML de Facebook, muchos campos pueden devolver None o dejar de funcionar tras cambios en la web, y un uso intensivo puede provocar bloqueos temporales de tu IP. Además, el scraping de contenido de Facebook puede vulnerar sus Términos de Servicio, así que revisa las implicaciones legales antes de usarlo.