Implementación de un método de clasificación autónomo de datos extraídos desde twitter para el apoyo en la toma de decisiones

Rivas Vergara, Felipe

Mostrar el registro sencillo de la publicación

dc.contributor.author	Rivas Vergara, Felipe
dc.date.accessioned	2017-10-17T20:42:07Z
dc.date.available	2017-10-17T20:42:07Z
dc.date.issued	2014
dc.identifier.uri	http://repositorio.ucm.cl/handle/ucm/656
dc.description	Tesis para optar al título de Ingeniero Civil Informático	es_CL
dc.description.abstract	En el presente trabajo, se realiza una investigación guiada por la Dra. Angélica Urrutia y parte del Grupo Tricahue, para optar al título de Ingeniero Civil Informático de la Universidad Católica del Maule. Su finalidad es brindar una propuesta para el análisis de la información en sistemas de toma de decisión en la web. De esta manera, se apoya el estudio de nuevas propuestas de análisis de datos no organizados, que facilitan la construcción de sistemas de recomendación, aportando así al desarrollo de futuras investigaciones, que profundicen el estudio en temáticas como la extracción de datos relevantes de los comentarios que realizan usuarios de un servicio específico. El objetivo de esta investigación es enfocarse en la tarea de la clasificación de opiniones no categorizadas, específicamente codificando la polaridad de opiniones es decir, diferenciar aquellas opiniones que expresan algo a favor de aquellas que expresan algo en contra. De esta forma, a nivel de oración se codifican los datos, a través de un algoritmo, que utiliza las características léxicas, entregadas por los usuarios que evalúan diversas temáticas de una empresa. Cabe mencionar, que una de las contribuciones de este trabajo es la caracterización de opiniones, necesaria para su clasificación automática. Además, en la actualidad, no existe un corpus etiquetado en idioma español, lo que dificulta el proceso de aprendizaje. Es por ello, que en este trabajo se da un aporte para la creación de este corpus. Específicamente, se propone un enfoque de aprendizaje semi-supervisado de clasificación de textos de opinión, disminuyendo la necesidad de un gran corpus ya etiquetado. En esta investigación, se aplica la metodología KDD (Descubrimiento de Conocimiento en Bases de Datos), esta consiste en un proceso no-trivial de descubrir conocimiento e información potencialmente útil dentro de los datos contenidos en algún repositorio de información. No es un proceso automático, es un proceso iterativo que exhaustivamente explora volúmenes muy grandes de datos para determinar relaciones. A través de las etapas de la metodología KDD, se describe el análisis de la problemática, seguido de un diseño de arquitectura de trabajo. De esta manera, se procede al análisis de la información obteniendo la polaridad de los comentarios, lo cual se conoce como análisis de sentimiento. Para terminar se unifica la información adquirida y se dan a conocer los resultados.	es_CL
dc.language.iso	es	es_CL
dc.publisher	Universidad Católica del Maule, Facultad de Ciencias de la Ingeniería	es_CL
dc.rights	Atribución-NoComercial-SinDerivadas 3.0 Chile	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/cl/	*
dc.subject	Redes sociales en línea	es_CL
dc.subject	Procesamiento electrónico de datos	es_CL
dc.subject	Minería de datos	es_CL
dc.title	Implementación de un método de clasificación autónomo de datos extraídos desde twitter para el apoyo en la toma de decisiones	es_CL
dc.type	Thesis	es_CL
dc.ucm.uri	sibib2.ucm.cl:2048/login?url=http://guiastematicas.biblioteca.ucm.cl/ld.php?content_id=36668789	es_CL
dc.ucm.profesorguia	Urrutia Sepúlveda, Angélica
dc.ucm.anexotesis	sibib2.ucm.cl:2048/login?url=http://guiastematicas.biblioteca.ucm.cl/ld.php?content_id=36668845	es_CL

Ficheros en la publicación

Ficheros	Tamaño	Formato	Ver
No hay ficheros asociados a esta publicación.

Esta publicación aparece en la(s) siguiente(s) colección(ones)

Ingeniería Civil Informática

Mostrar el registro sencillo de la publicación

Excepto si se señala otra cosa, la licencia de la publicación se describe como Atribución-NoComercial-SinDerivadas 3.0 Chile

Listar

Mi cuenta

Implementación de un método de clasificación autónomo de datos extraídos desde twitter para el apoyo en la toma de decisiones

Ficheros en la publicación

Esta publicación aparece en la(s) siguiente(s) colección(ones)