Web Scraping Steam Review Like/Dislike

Web Scraping usando Scrapy Spider para obtener el resultado de la reseña de un usuario sobre un juego en la Tienda Steam (like/dislike), a partir de una lista de urls con el siguiente formato:

data.csv

url
https://steamcommunity.com/profiles/<user_id>/recommended/<product_id>
https://steamcommunity.com/id/<username>/recommended/<product_id>
...

Campos:

user_id es el id usuario de Steam.
username es el nickname del usuario en Steam.
product_id es el id del juego en la Tienda Steam.

Los mismos deben encontrarse dentro de data.csv (ejemplo incluido dentro del repositorio).

Uso

Crear un entorno de python y activarlo (ej. virtualenv):

virtualenv env -p python3
source env/bin/activate

Clonar el repositorio:

git clone https://github.com/bruino/scraping-reviews-steam.git

Ir al directorio scraping-reviews-steam:

cd scraping-reviews-steam

Instalar las librerías:

pip install -r requirements.txt

Ejecutar:

scrapy crawl steam -o steam_reviews_likes_users.jl

El resultante es un archivo steam_reviews_likes_users.jl del tipo Json Line.

{"game": "357070", "user": "bruino", "recommended": 1}
...

Atención

Debido a que en algunos casos surgen redireccionamientos (HTTP Redirect Status) y algunos perfiles de usuarios de Steam son privados, se aplico la siguiente configuración que omite aquellos casos especiales.

settings.py

REDIRECT_ENABLED = False

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
images		images
steam		steam
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
data.csv		data.csv
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg
steam_reviews_likes_users.jl		steam_reviews_likes_users.jl

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Web Scraping Steam Review Like/Dislike

Uso

Atención

About

Uh oh!

Uh oh!

Languages

License

bruino/scraping-reviews-steam

Folders and files

Latest commit

History

Repository files navigation

Web Scraping Steam Review Like/Dislike

Uso

Atención

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Uh oh!

Languages