eocode/Amazon-Web-Scraping-y-Clusterizacion-con-RPublic

NotificationsYou must be signed in to change notification settings
Fork0
Star0

Un caso de estudio aplicando técnicas de construcción de bases de datos y algoritmos de clasificación de datos con R

License

GPL-3.0 license

0 stars 0 forks Branches Tags Activity

Star

Notifications

You must be signed in to change notification settings

Branches Tags

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
img		img
.gitignore		.gitignore
0 - Scraping.R		0 - Scraping.R
1 - extract.R		1 - extract.R
2 - transform.R		2 - transform.R
3 - k-means.R		3 - k-means.R
4 - KmeansPbMain.R		4 - KmeansPbMain.R
4 - celularesPlumber.R		4 - celularesPlumber.R
5 - server.R		5 - server.R
5 - ui.R		5 - ui.R
LICENSE		LICENSE
Proyecto.Rproj		Proyecto.Rproj
README.html		README.html
README.md		README.md
WebScraping y Clusterizacion.pdf		WebScraping y Clusterizacion.pdf
celulares.csv		celulares.csv
celularesKmeans.csv		celularesKmeans.csv
celulares_limpio.csv		celulares_limpio.csv

Repository files navigation

Un caso de estudio aplicando conceptos de DataScience

Para el desarrollo del proyecto se tomo como base lo siguiente:

La compañía Patito quiere iniciar operaciones en México, lanzará una nueva línea de equipos celulares por lo que requiere de hacer un análisis de mercado para tomar decisiones que le ayuden a competir

Los pasos a realizar van en orden secuencial del 0 al 5 en el código, mismos que se describen, el caso completo se puede ver dentro del PDF incluído:PDF del caso de estudio ficticio para la empresa patitoPara ello se realizó lo siguiente:

0 - Scraper

Se identificaron posibles variables a extraer y se realizaron funciones para obtener la información:

build_pagination_pages - Construye las páginas a consultar
get_page_links - Obtiene los enlaces a los productos, en este caso de los celulares
get_selector_text y get_selector_table - Configuran los selectores para la extracción de texto y tablas dentro del sitio
get_product - Obtiene los datos del producto a extraer y lo deposita en un DataFrame para su revisión

Requiere el paquete RVEST

1 - Extracción

Se configuran las variables, indicando el sitio, termino a búscar y la estructura del paginador, así como la cantidad de páginas

base_url="https://www.amazon.com.mx"uri="/s?k=celulares"page="&page=x"start=1end=5

Posteriormente se ejecutan los comandos que llaman a las funciones del scraper y se guarda en un csv

2 - Limpieza y transformaciones

La información no viene como la queremos, por lo que hay que limpiar y corregir ciertos valores

3 - Se prueba el modelo no supervisado K-means para poder clasificar los productos

Para ello el dataset toma unicamente los valores continuos excluyendo factores del dataset para poder trabajar, y se realizan visualizaciones sencillas

4 - Montar una API con Plumber

Con nuestro modelo, ahora con ayuda de Plumber podemos montar una API que al ingresar nuevos datos nos de el clúster al que pertenece acorde a las variables de entrada

5 - Montar un sitio web con Shiny

Finalmente se implementa el algoritmo con Shiny para desplegar nuestras variables en una herramienta visual e interactiva

¿Cómo contribuir?

Enviame un pull request o contactame como eocode en redes sociales

About

Un caso de estudio aplicando técnicas de construcción de bases de datos y algoritmos de clasificación de datos con R

Releases

No releases published

Packages

No packages published

Languages

R100.0%

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Un caso de estudio aplicando conceptos de DataScience

0 - Scraper

1 - Extracción

2 - Limpieza y transformaciones

3 - Se prueba el modelo no supervisado K-means para poder clasificar los productos

4 - Montar una API con Plumber

5 - Montar un sitio web con Shiny

¿Cómo contribuir?

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

Movatterモバイル変換

License

eocode/Amazon-Web-Scraping-y-Clusterizacion-con-R

Folders and files

Latest commit

History

Repository files navigation

Un caso de estudio aplicando conceptos de DataScience

0 - Scraper

1 - Extracción

2 - Limpieza y transformaciones

3 - Se prueba el modelo no supervisado K-means para poder clasificar los productos

4 - Montar una API con Plumber

5 - Montar un sitio web con Shiny

¿Cómo contribuir?

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages0

Languages

Packages