El presente proyecto consiste en predecir la relación de empresas de telecomunicaciones con sus clientes y para ello se hará uso de tecnologías de minería de datos y data science usando como caso de estudio los datos de empresa Orange S.A disponibles libremente en internet. Para el desarrollo del proyecto se usará la metodología CRISP – DM propuesta por SPSS-IBM. Se realizará el diseño de la arquitectura del proceso de extracción de conocimiento. La construcción de la tabla minable se hará con la herramienta de ETL: Pentaho. Los datos se subirán a una base de datos en los que se procederá a procesarlos. Para la parte de preparación de datos, dado que se tienen 15000 columnas; se evaluará el uso del lenguaje de programación Python o R en un ambiente de desarrollo denominado Anaconda (en el que se encuentran todas las librerías necesarias para este análisis). Esta tarea también puede ser realizada con la herramienta Rapidminer. Se aplicarán técnicas de reducción de dimensiones para disminuir la cantidad de variables Para los modelos a realizar, churn, apetencia y up selling se propondrán algoritmos de aprendizaje supervisado predictivo. Los 3 modelos serán compartidos a través de servicios web que podrán ser consumidos por aplicaciones.