Mostrar el registro sencillo de la publicación

dc.contributor.authorRivas Vergara, Felipe
dc.date.accessioned2017-10-17T20:42:07Z
dc.date.available2017-10-17T20:42:07Z
dc.date.issued2014
dc.identifier.urihttp://repositorio.ucm.cl/handle/ucm/656
dc.descriptionTesis para optar al título de Ingeniero Civil Informáticoes_CL
dc.description.abstractEn el presente trabajo, se realiza una investigación guiada por la Dra. Angélica Urrutia y parte del Grupo Tricahue, para optar al título de Ingeniero Civil Informático de la Universidad Católica del Maule. Su finalidad es brindar una propuesta para el análisis de la información en sistemas de toma de decisión en la web. De esta manera, se apoya el estudio de nuevas propuestas de análisis de datos no organizados, que facilitan la construcción de sistemas de recomendación, aportando así al desarrollo de futuras investigaciones, que profundicen el estudio en temáticas como la extracción de datos relevantes de los comentarios que realizan usuarios de un servicio específico. El objetivo de esta investigación es enfocarse en la tarea de la clasificación de opiniones no categorizadas, específicamente codificando la polaridad de opiniones es decir, diferenciar aquellas opiniones que expresan algo a favor de aquellas que expresan algo en contra. De esta forma, a nivel de oración se codifican los datos, a través de un algoritmo, que utiliza las características léxicas, entregadas por los usuarios que evalúan diversas temáticas de una empresa. Cabe mencionar, que una de las contribuciones de este trabajo es la caracterización de opiniones, necesaria para su clasificación automática. Además, en la actualidad, no existe un corpus etiquetado en idioma español, lo que dificulta el proceso de aprendizaje. Es por ello, que en este trabajo se da un aporte para la creación de este corpus. Específicamente, se propone un enfoque de aprendizaje semi-supervisado de clasificación de textos de opinión, disminuyendo la necesidad de un gran corpus ya etiquetado. En esta investigación, se aplica la metodología KDD (Descubrimiento de Conocimiento en Bases de Datos), esta consiste en un proceso no-trivial de descubrir conocimiento e información potencialmente útil dentro de los datos contenidos en algún repositorio de información. No es un proceso automático, es un proceso iterativo que exhaustivamente explora volúmenes muy grandes de datos para determinar relaciones. A través de las etapas de la metodología KDD, se describe el análisis de la problemática, seguido de un diseño de arquitectura de trabajo. De esta manera, se procede al análisis de la información obteniendo la polaridad de los comentarios, lo cual se conoce como análisis de sentimiento. Para terminar se unifica la información adquirida y se dan a conocer los resultados.es_CL
dc.language.isoeses_CL
dc.publisherUniversidad Católica del Maule, Facultad de Ciencias de la Ingenieríaes_CL
dc.rightsAtribución-NoComercial-SinDerivadas 3.0 Chile*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/*
dc.subjectRedes sociales en líneaes_CL
dc.subjectProcesamiento electrónico de datoses_CL
dc.subjectMinería de datoses_CL
dc.titleImplementación de un método de clasificación autónomo de datos extraídos desde twitter para el apoyo en la toma de decisioneses_CL
dc.typeThesises_CL
dc.ucm.urisibib2.ucm.cl:2048/login?url=http://guiastematicas.biblioteca.ucm.cl/ld.php?content_id=36668789es_CL
dc.ucm.profesorguiaUrrutia Sepúlveda, Angélica
dc.ucm.anexotesissibib2.ucm.cl:2048/login?url=http://guiastematicas.biblioteca.ucm.cl/ld.php?content_id=36668845es_CL


Ficheros en la publicación

FicherosTamañoFormatoVer

No hay ficheros asociados a esta publicación.

Esta publicación aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo de la publicación

Atribución-NoComercial-SinDerivadas 3.0 Chile
Excepto si se señala otra cosa, la licencia de la publicación se describe como Atribución-NoComercial-SinDerivadas 3.0 Chile