Detección de SPAM

Hoy en dia es muy común que las empresas comuniquen sus promociones a través de mensajes de texto, esto genera malestar dado que muchas veces las ofertas/promociones que llegan no son del agrado o no interesan al usuario y para empeorar la situacion aun mas, llegan con mucha frecuencia. A raíz de este problema es que nos resultó interesante investigar acerca de esto y poder encontrar una manera de determinar de forma automática cuales mensajes corresponden a spam y cuáles no. Esto podría ser de gran ayuda si luego se quisiera automatizar la eliminación de los mismos o crear un aplicación que bloquee este tipo de mensajes. Es por esta razón que se busco un dataset el cual nos permitiera realizar dicha investigación. Lo que se busca con este caso de estudio es poder crear un modelo que permita predecir si un mensaje es SPAM o no.

Temperatura mínima en Melbourne

Hoy en dia la tecnología a avanzado hasta cierto punto que es posible predecir con más exactitud los hechos del futuro en base a como se a comportado en su pasado, a este tipo de técnica se la conoce como Time Series. Este tipo de técnica se aplica en varias áreas como ser finanzas, meteorología, industria, entre otros. Es por esta razón que nos pareció interesante estudiar un caso que clasificará dentro de la temática de Time Series. Motivados por la catédra nos adentramos en la búsqueda de un dataset, en el cual poder aplicar esta técnica. Luego de evaluar distintos datasets fue que nos encontramos con uno muy interesante y que se ajustaba perfectamente a lo que estábamos buscando. El mismo corresponde a un estudio realizado diariamente durante 10 año, en el cual se realizaron mediciones de la temperaturá mínima en la localidad de Melbourne, Australia.

Enfermedades cardíacas

El problema se basa en el estudio de enfermedades cardíacas, a partir del estudio de 4 dataset de datos tomados de 4 lugares geográficamente distantes (Cleveland - EE.UU. EAST, Hungría, Suiza, y VA Long Beach - EE.UU. WEST), obtenidos del sitio web de la Universidad de California (Irvine). El objetivo principal de este estudio es la predicción de la existencia de enfermedades al corazón del paciente. A partir de estos datasets, se pretende lograr una predicción de si el paciente padece/rá (o no) una enfermedad cardíaca. Dado lo costoso de los tratamientos médicos para enfermedades cardíacas, la intención es poder a partir de estos datos, predecir cuales son aquellos pacientes con mayor riesgo de enfermedades cardíacas, y así tratar a este tipo de pacientes de forma preventiva, y no reactiva. Con esto se disminuirían tanto los costos de tratamiento reactivo, así como evitar posibles cuadros cardíacos.

Motivación de este porfolio

Lo que buscamos con este porfolio es poder demostrar los conocimientos adquiridos durante el segundo semestre de 2017, en el cual cursamos la asignatura Introducción a los métodos de aprendizaje automático en el marco de las materias optativas de la Universidad Católica del Uruguay. En este van a encontrar soluciones propuestas a distintos problemas. En ellas podrán ver un proceso completo que va desde el análisis y preparación de los datos, hasta la generación de un modelo y su posterior utilización en una aplicación real.