Home
MANUAL DE USUARIO
Contents
1. Figura 16 b squeda por t rminos RESULTADOS DE UNA CONSULTA El sistema muestra los documentos devueltos en una ventana como la siguiente Resultado B squeda AROUVITECTURA DE ADQUISICION DE CONOCIMIENTO espanol frances Resultado B squeda Idioma PERSONAS_ENTIDADES PERSONAS_PAISES LUGAR TPO ae of fg Consulta realizada secretario Nestl EEUU de_empresa auiliar secretario ECRETARIO economia28_txt El Nasdaq reconcomido por los beneficios warning economia27_txt El CAC 40 recupera la buena cara economia17 txt El d lar prosigue su ca da economia65_txt El CAC 40 acent a sus perdidas economia05_txt A largo plazo cada una de las dos monedas tiene razones para debilitarse mucho Figura 17 resultado de los documentos 30 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario En la parte superior pueden verse dos pesta as con el nombre de un idioma cada una Marcan el conjunto de documentos devueltos para cada uno de ellos Para cada idioma se muestra un grafico con la secci n de la ontologia implicada en la consulta Es el grafico que se puede ver en la parte superior derecha Tambi n se muestra la consulta introducida por el usuario En la parte inferior se muestran los documentos agrupados segun el t rmino que los ha devuelto y organizados por su relevancia E
2. 444 39 3 manual del usuario experto nn anne 41 3 1 a adir UN Cxtrect Oh 3358043 wes prea eeaaieseaaeare uence 41 3 2 a adir un analizador sint ctico 43 4 Adquisici n semi autom tica del conocimiento una arquitectura preliminar tabla de contenidos indice de Figuritas 40 4 indice E KOLA z ana dob NON ake dd ovat trent 49 Adguisici n semi autom tica del conocimiento una arguitectura preliminar 5 MANUAL DE INSTALACION manual de instalaci n 1 MANUAL DE INSTALACION En esta secci n del manual de usuario se describe la instalaci n de los recursos necesarios para poder funcionar con la herramienta desarrollada 1 1 REOUISITOS DE HARDWARE gt CPU 400 Mhz o superior recomendable 1 5GHz El tipo de procesador es indiferente el Unico requisito es que exista una maquina virtual de java para dicho procesador gt Memoria 512MB recomendable 1GHz gt Disco duro 20 GB gt Conexi n a Internet para permitir a la herramienta de traducci n de Google realizar las traducciones gt Unidad de disco 1 2 REQUISITOS DE SOFTWARE 1 2 1 REOUISITOS GENERALES Se describen en este apartado cuales son los requisitos para la arquitectura general implementada gt Sistema operativo Linux para poder ejecutar aquellas herramientas desarrolladas para el caso concreto Se recomienda una distribuci n basada en Debian Adquisici n semi autom tica del conocimiento una arquitect
3. En este fichero se tienen inicialmente un conjunto de propiedades base para iniciar el proceso Adem s en las sucesivas ejecuciones este fichero se va modificando incorporando nuevas propiedades En la primera columna se tiene la palabra que marca la propiedad y en la segunda el tipo de propiedad El usuario puede modificar el tipo de propiedad asi como eliminar aquellas que no considere oportunas Todo ello con cuidado de separar las palabras de tipo de propiedad con una tabulaci n europeo LUGARES baja TAMA O ca da TAMA O krach TAMANO junio PERIODO a o PER ODO d a PER ODO abril PER ODO mitad TAMA O americano LUGARES parisino LUGARES alto TAMA O internacional LUGARES franc s LUGARES general TIPO nico TIPO FICHERO MERCADOS TXT La interpretaci n de este fichero y su manipulaci n es la misma que la del fichero PROPIEDADES txt explicado arriba Se diferencia en que MERCADOS txt se refiere a los conceptos hallados en el corpus ministro PERSONAS fluctuaci n DINEROS banco ENTIDADES divisa DINEROS grupo ENTIDADES inversor PERSONNES Dow amp Jones INDICES Nikkei INDICES 28 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario 2 4 VISTA B SQUEDA Se describe en este apartado como se procede a la recuperaci n de documentos relevantes a la consulta del usuario Antes de describir la operaci n para cada una de las posibles b squedas se ind
4. n la vista correspondiente a la operaci n descrita Adguisici n de conocimiento MENU PRINCIPAL SK ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO s Corpus B squedas Configuraci n Corpus Generaci n Generaci n Fo Clasificaci n o m Elige un corpus economia v Elige un idioma Elige un analizador sint ctico espanol y erialES v Directorio de documentos de corpus Examinar Actualizar Corpus Figura 7 vista generaci n NOTA En el caso concreto desarrollado y dadas las caracteristicas de las herramientas incluidas los textos deben ser proporcionados con el formato UTF 8 Adquisici n semi autom tica del conocimiento una arquitectura preliminar 21 manual del usuario 2 3 CLASIFICACI N Para acceder a la vista de clasificaci n se selecciona la opci n correspondiente en el men principal 2 3 1 CLASIFICACI N POR T RMINOS En primer lugar se va a detallar la clasificaci n por t rminos Ahora bien no tiene porque llevarse esta tarea a cabo antes que la clasificaci n por dependencias Ambas tareas son independientes la una de la otra Se selecciona la opci n de clasificaci n y a continuaci n la pesta a t rminos La vista disponible es la siguiente Adquisici n de conocimiento MENU PRINCIPAL x ARQUITECTURA DE ADODISICION DE CONOCIMUENTO Corpus B squedas Configuraci n Corpus Generaci n Clasificaci n Clasificaci
5. que se muestra como ya se ha comentado es la de la Figura 5 descrita en el apartado anterior En primer lugar se elige en el men principal situado arriba a la derecha la vista corpus Una vez en esa vista se elige la generaci n de corpus Con esta opci n se van a poder introducir nuevos documentos al sistema y por consiguiente se va a actualizar el corpus se realizar el an lisis sint ctico de cada documento y se actualizar el ndice asociado El usuario elegir el tema una vez elegido un tema se muestran los idiomas disponibles para el mismo Una vez el idioma elegido pueden suceder dos cosas gt Si el idioma no tiene ning n recurso de tipo analizador sint ctico asignado En este caso el sistema muestra un mensaje de error como el siguiente El idioma no tiene parser asignado Figura 6 error idioma sin recurso asociado gt Si los datos son correctos se muestran los analizadores sint cticos disponibles para ese idioma 20 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario Si se ha producido el segundo caso el usuario ya puede indicar la ruta del nuevo documento que se va a adir asociado al idioma y tema elegido Tambi n cabe la posibilidad de que se introduzca un directorio Con todos los datos disponibles se selecciona el bot n Actualizar corpus y empieza el proceso Una vez ste ha finalizado es posible realizar el resto de las tareas Se muestra a continuaci
6. los m todos descritos Tiene cinco atributos que son label lemal lema2 posl pos2 y su constructor inicializa esos valores DependencyData String label String lemal String lema2 String posl String pos2 44 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario gt getVectorDependency Este m todo devuelve el ArrayList generado con las dependencias gt getVectorTagger Este m todo devuelve el ArrayList generado con la informaci n de las palabras gt getSentence Este m todo devuelve una cadena que es la frase actual En cuanto al fichero de configuraci n es necesario acceder al nodo correspondiente a los analizadores lt parsers gt lt parser lang es gt lt analyzer name erialES gt lt rutaParser gt Analyzer espanol erialES lt rutaParser gt lt claseParser gt universidad proyecto recursos parser ErialES lt claseParser gt lt analyzer gt lt parser gt lt parser lang fr gt lt analyzer name erialFR gt lt rutaParser gt Analyzer frances erialF R lt rutaParser gt lt claseParser gt universidad proyecto recursos parser ErialF R lt claseParser gt lt analyzer gt lt parser gt lt parsers gt En primer lugar hay que seleccionar el idioma asociado al analizador para ello se introducira el nodo correspondiente al nuevo analizador bajo el nodo parser cuyo atributo lang sea la abreviatura del idioma elegido Si se supone que el nuevo ana
7. se supone que el nuevo extractor a adido es acabit se alado en negrita el usuario deber acceder al nodo ext con lang fr A continuaci n a adir un nodo de tipo extractor con un atributo name gue sea el nombre del extractor Este nombre debe ser unico en el sistema En el nodo rutaExtract se definir la ruta donde se ubica el extractor si ste es un recurso externo En el nodo clase es necesario indicar el nombre de la clase gue ejecuta el extractor Es necesario indicar el paguete entero donde se encuentra la clase 3 2 ANADIR UN ANALIZADOR SINT CTICO La interfaz de un analizador sint ctico solicita que se implementen cinco m todos Es importante tener en cuenta gue el analizador sint ctico debe analizar los documentos frase a frase gt setValores String tema Se le pasa el tema actual Este m todo no devuelve ningun valor gt startParser String frase Este m todo debe lanzar el an lisis sint ctico de la frase que se le pasa como par metro El usuario puede implementar directamente un proceso o indicar una llamada externa En cualquier caso debe almacenar los resultados de la siguiente forma Para cada una de las palabras de la frase se debe guardar su informaci n morfosint ctica y l xica Para ello se deber crear un ArrayList de tipo Tagger Esta interfaz proporciona los siguientes m todos o getLabel Devuelve la etiqueta asignada a la palabra El retorno debe ser una cadena o getForma Devuelve
8. CI N POR DEPENDENCIAS Se selecciona la opci n de clasificaci n y a continuaci n la pesta a dependencias El usuario puede entonces introducir el tema e idioma Efectuado esto puede desencadenar dos eventos gt Si el tema asociado al idioma y al corpus no existe el sistema mostrar un mensaje como el de la Figura 9 gt Si el corpus asociado existe se muestra entonces el bot n que permite activar la clasificaci n por dependencias este bot n es el titulado Lanzar Clasificaci n 24 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario Adguisici n de conocimiento MENU PRINCIPAL gt ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO Corpus B squedas Configuraci n Corpus Generaci n Clasificaci n Ertl Slasificaciony 5 wp Por Terminos Por Dependencias Por Dependencias Elige un corpus Elige un idioma economia w Lanzar Clasificacion Figura 12 vista principal clasificaci n por dependencias Una vez el usuario seleccione el bot n Lanzar Clasificaci n se le mostrar un mensaje como el siguiente para que confirme la operaci n que se va a llevar a cabo A Se va a proceder a la CLASIFCACI N POR DEPENDENCIAS con estos par metros TEMA economia IDIOMA espanol Figura 13 aviso clasificaci n por dependencias Si el usuario ha pulsado que s se lanza el proceso que habr fi
9. El sistema a ade el nuevo idioma que ya estar disponible para todas las operaciones oportunas Se muestra una frase indicando el xito de la operacion Si el usuario desea que la b squeda de documentos se produzca en m s de un idioma debe tener en cuenta cuales son los idiomas disponibles en el traductor de Google as como las abreviaturas asociadas a esos idiomas Para ello puede consultar el documento abreviaturasGoogle txt en el directorio distribuci n configuracion El fichero de palabras de parada debe contener una palabra por l nea y el nombre del mismo ser nombre del idiomaStopWords txt y deber guardarse en el directorio Ontologia stopWords BORRAR UN IDIOMA En el caso de que el usuario desee borrar un idioma entonces debera seleccionar el formulario de la derecha Elegir un idioma para borrar entonces el sistema mostrar un di logo de aviso como l de la Figura 21 solicitando la confirmaci n del usuario sobre la operaci n que se va a realizar Si confirma el di logo se borrar n todas las referencias del idioma en el fichero de configuraci n as como todas las estructuras de directorios asociadas 36 Adquisici n semi autom tica del conocimiento una arquitectura preliminar Manual del usuario 2 5 3 GESTI N DE EXTRACTORES La gesti n de los extractores se lleva a cabo a trav s de la siguiente vista Adquisici n de conocimiento MENU PRINCIPAL Corpus B squedas Configuraci n x ARQUITEC
10. MANUAL DE USUARIO adquisici n semi autom tica del conocimiento una arquitectura preliminar tabla de contenidos TABLA DE CONTENIDOS Adquisici n semi autom tica del conocimiento una arquitectura preliminar 3 tabla de contenidos manual CE Instalaci n xica li a M KA desa 7 1 manual de instalaci n aut dacs teens 9 1 1 requisitos de hardware init asien 9 1 2 requisitos de SOfLWANE 2 0d xeon ii 9 1 2 1 requisitos generales cece cece eee nennen nen eterna ened 9 1 2 2 requisitos CSPECIFICOS 0 cece eee terrieri inttr eee e nana eee nenn nenn 10 1 2 3 instalaci n de los programas NECESALIOS cece cece 4 ee ee ene 10 1 3 instalaci n de la aplicaci n A 13 manual del usuario ci A A AA 15 2 manual del S ii 17 2 1 arrancar la Nerea de 17 Ded MSCA COTPUG Ana basa ato aa A E EEDE iS 20 2 2 Le GeneraclOmsa rides ee A Aa eS aes 20 23r ClASITICACION z eier 22 2 3 1 clasificaci n por t rMiNOS 2 22 2 3 2 clasificaci n por dependenciaS eset ee ee eee eaene ees 24 2 4 Vista DUSQUCO a z iii dod dod oo n dd eens kel cheese l 29 2 4 1 b squeda por t rminos 0 29 2 4 2 b squeda por dependenciaS nennen nn 32 2 5 VISka CONMGQUFACION vitnastdina Aa 32 2 5 1 gesti n de LOMAS sudy 4 ta 33 2 5 2 gesti n de idiomas 44 rn 35 2 5 3 gesti n de extractores eeter eere EEEE EEEE EEEE 37 2 5 4 gesti n de analizadores Sint ctiCOS
11. SIFICACI N POR T RMINOS con estos par metros TEMA economia IDIOMA espanol EXTRACTORES espanol fastr es espanol gamallo E Figura 10 aviso clasificaci n por t rminos Una vez la extracci n ha finalizado se muestra el bot n de Lanzar Clasificaci n que el usuario deber pulsar Cuando la clasificaci n retorne se activar el bot n de Crear Ontolog a el usuario deber pulsarlo para generar la ontolog a correspondiente a los t rminos En este ltimo caso se generar la ontolog a correspondiente Adquisici n semi autom tica del conocimiento una arquitectura preliminar 23 manual del usuario Adquisici n de conocimiento MENU PRINCIPAL x ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO Corpus B squedas Configuraci n Corpus Generaci n Clasificaci n 5 Clasificaci n s cel Por Terminos Por T rminos Br Elige un corpus Por Dependencias Elige un idioma Elige los extractores v fastr_es vr gamallo Crear Ontologia Figura 11 vista clasificaci n por t rminos crear la ontolog a En esta figura se muestra el ltimo bot n activado del proceso de clasificaci n por t rminos el bot n de Crear Ontolog a Una vez se ha creado la ontolog a sta puede recuperarse en el directorio Ontologia temaActual idiomaActual ontologia donde temaActua e idiomaActual son respectivamente el tema e idioma que el usuario ha elegido 2 3 2 CLASIFICA
12. TURA DE ADODISICION DE CONOLIAUENTO Configuraci n Declarar Corpus x Herramientas Extractor Analizador Extractor Nuevo Elige un idioma Te Clase del Extractor FE SE RER ExtractorNuevo Nombre del Extractor Herramientas 44 0 Extractor Borrar Extractor Elige un Extractor v BorrarExtractor Figura 23 vista gesti n extractor En la figura anterior se muestran dos formularios El de la izquierda permite a adir un nuevo extractor y el de la derecha borrar un extractor A ADIR UN EXTRACTOR El usuario elige a adir un nuevo extractor a trav s del formulario de la izquierda Para ello debe elegir el idioma del extractor introducir el nombre del extractor y el nombre del recurso asociado esto es la clase que lo implementa Esto puede hacerlo escribiendo la ruta completa o bien pulsando el bot n que desplegar un di logo para seleccionar archivos con extensi n java o class si la clase ya est compilada Una vez proporcionados estos par metros y pulsado el bot n de ExtractorNuevo se pueden desencadenar tres eventos Adquisici n semi autom tica del conocimiento una arquitectura preliminar 37 manual del usuario gt Si el nombre del extractor ya existe en el sistema se muestra una caja de di logo similar a la de la Figura 20 en la que se indicar que el nombre del extrac
13. an hay que bajarse el fichero con extensi n bin gt El proceso de instalaci n acceder a ciertos directorios para los cuales es necesario tener permisos de administrador por lo tanto se abre una consola y se entra tecla sudo s a continuaci n se solicita la contrase a habr que introducir la del administrador gt Se dan permisos de ejecuci n al archivo que se acaba de descargar nota en la notaci n se pone lt version gt el usuario har coincidir ese valor con la versi n que se descargue jdk lt version gt linux i586 bin gt Se copia dicho archivo a usr local jdk si no existe hay que crear este directorio gt Se ejecuta el archivo desde la ubicaci n anterior escribiendo en la consola jdk lt version gt linux i586 bin En la consola se solicitar aceptar la licencia gt Una vez instalado es necesario actualizar la variable PATH del sistema a adi ndole la ruta del directorio donde se acaba de instalar el jdk Para ello el usuario puede acceder al bashrc de su home o bien editar el fichero etc profile para lo cual necesitar permisos de administrador B INSTALACI N DE LA HERRAMIENTA ANT Esta herramienta se descarga del sitio web http ant apache org bindownload cgi gt Se crea el directorio usr local ant para cuyo acceso se necesitan permisos de administrador gt El fichero descargado debe situarse en el directorio usr local ant Adquisici n semi autom tica del conocim
14. cesario que el primero est creado De este modo al crear un idioma mientras no se le asocie un tema su estado permanece desactivado y no puede participar en ninguna operaci n gt Si el usuario introduce como nombre del tema un valor que ya existe en el fichero de configuraci n entonces se presenta un mensaje como ste Adquisici n semi autom tica del conocimiento una arquitectura preliminar 33 manual del usuario x El nombre del tema esta repetido Figura 20 error tema repetido gt Si la operaci n se realiza correctamente entonces se muestra una frase indicando que hubo xito El sistema a ade el nuevo tema que ya estara disponible para todas las operaciones oportunas BORRAR UN TEMA En el caso de que el usuario desee borrar un tema entonces deber seleccionar el formulario de la derecha Elegir un tema para borrar entonces el sistema mostrar un di logo de aviso solicitando la confirmaci n del usuario Si confirma el di logo se borrar n todas las referencias del tema en el fichero de configuraci n as como todas las estructuras de directorios asociadas A Se va a eliminar TEMA finanzas con todos sus directorios Estas de acuerdo Ge Figura 21 aviso eliminar un elemento 34 Adquisici n semi automatica del conocimiento una arquitectura preliminar manual del usuario 2 5 2 GESTION DE IDIOMAS La gesti n de los idiomas se lleva a cabo a trav s de la siguiente vista Adquisici
15. configuraci n que originalmente est vac o 14 Adquisici n semi autom tica del conocimiento una arquitectura preliminar MANUAL DEL USUARIO manual del usuario 2 MANUAL DEL USUARIO 2 1 ARRANCAR LA HERRAMIENTA En un primer instante una vez se ha lanzado la aplicaci n la pantalla de acogida es la que se puede ver en la siguiente figura Adguisici n de conocimiento MENU PRINCIPAL INTRODUCE EL FICHERO DE CONFIGURACION Ejes ag Figura 1 entrada a la aplicaci n En la esguina superior derecha se encuentra una caja de texto donde se deber introducir la ruta en la gue se ubica el fichero de configuraci n El bot n cuyo s mbolo son tres puntos abrir una caja de di logo gue permitir elegir el fichero de configuraci n navegando por el disco Se muestra a continuaci n dicha caja Adquisici n semi autom tica del conocimiento una arquitectura preliminar 17 manual del usuario MENU PRINCIPAL INTRODUCE EL FICHERO DE CONFIGURACION Corpus B squedas Configuraci n Buscar en C configuracion c Confviejo c DTD Ey configuracion xml Ey formato xml Nombre de archivo Archivos de tipo E lr Cancelar Figura 2 elegir un fichero de configuraci n Esta caja de dialogo s lo permite elegir ficheros con extensi n xml que es la que debe poseer el fichero de configuraci n Una vez se ha int
16. e un Analizador vi v Nombre del Analizador Clase del Analizador BorrarAnalizador jE AnalizadorNuevo Figura 25 vista gesti n analizador En la figura anterior se muestran dos formularios El de la izquierda permite a adir un nuevo analizador sint ctico y el de la derecha borrar un analizador sint ctico ANADIR UN ANALIZADOR SINTACTICO El usuario elige a adir un nuevo analizador a trav s del formulario de la izquierda Para ello debe elegir el idioma del analizador sint ctico introducir el nombre del mismo y el nombre del recurso asociado esto es la clase que lo implementa Esto puede hacerlo escribiendo la ruta completa o bien pulsando el bot n que desplegar un di logo para seleccionar archivos con extensi n java o class si la clase ya est compilada Una vez proporcionados estos par metros y pulsado el bot n de AnalizadorNuevo se pueden desencadenar tres eventos Adquisici n semi autom tica del conocimiento una arquitectura preliminar 39 manual del usuario gt Si el nombre del analizador ya existe en el sistema se muestra entonces una caja de di logo similar a la de la Figura 20 indicando que el analizador ya existe en el sistema gt Si la clase introducida contiene errores se muestra una caja de di logo similar a la de la Figura 24 en la cual se indica que el nombre del analizador ya existe en el sistema g
17. en el fichero de configuraci n 3 1 ANADIR UN EXTRACTOR La interfaz de un extractor solicita que se implementen cuatro m todos gt setValores String tema Se le pasa el tema actual Este m todo no devuelve ning n valor gt etiquetador En este m todo el usuario deber implementar la etiquetaci n de las palabras Se ha comentado a lo largo de la documentaci n que esta funcionalidad no tiene porque ser necesaria pues el propio extractor podr a traer incorporado una t cnica de etiquetaci n propia Este m todo no devuelve ning n valor gt execExtract En este m todo se deber indicar toda la l gica de la extracci n El usuario puede implementar un algoritmo directamente o realizar una llamada a un proceso externo En cualquier caso el resultado de la extracci n debe almacenarse siguiendo la siguiente nomenclatura Utilizando una clase de apoyo como RdoTerminos cuya estructura es la siguiente Adquisici n semi autom tica del conocimiento una arquitectura preliminar 41 manual del usuario ATRIBUTOS o termino T rmino devuelto por la extracci n o frecuencia Frecuencia de aparici n del t rmino o extractor Extractor que ha dado lugar al t rmino M TODOS o RdoTerminos String termino String frecuencia String extractor o getTermino Devuelve el valor del t rmino actual El retorno es una cadena o getFrecuencia Devuelve la frecuencia de aparici n del t rmino El retorno es una cadena o getE
18. est explicada en el aparatado anterior S lo a adir gue en este caso s se devuelven los resultados para m s de un idioma 2 5 VISTA CONFIGURACI N El usuario deber elegir en el men principal la opci n de Configuraci n En ella se muestra un contenedor principal con dos pesta a declarar corpus y herramientas En el primer caso se trata de manipular los temas e idiomas y en el segundo caso se trabaja con los analizadores sint cticos y extractores 32 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario 2 5 1 GESTION DE TEMAS La gesti n de temas se lleva a cabo a trav s de la siguiente vista Adquisici n de conocimiento MENU PRINCIPAL x ARQUITECTURA DE ADODISICION DE CONOLIWMENTO Corpus B squedas Configuraci n Configuraci n Declarar Corpus Declarar Corpus PAi Herramientas a TT Tema Tema Nuevo Borrar Tema Nombre del Tema Elige un Tema zj Idiomas asociados espanol frances BorrarTema TemaNuewo Figura 19 vista gesti n tema En la figura anterior se muestran dos formularios El de la izquierda permite a adir un nuevo tema y el de la derecha borrarlo A ADIR UN TEMA En el formulario de alta es necesario que el usuario introduzca el nombre del tema as como el conjunto de idiomas asociados a ese tema Aqu una importante aclaraci n para a adir un idioma a un tema es ne
19. ica que las consultas del usuario pueden incluir las palabras clave AND NOT y OR y pueden combinar los t rminos con par ntesis 2 4 1 B SQUEDA POR T RMINOS En primer lugar ser necesario elegir un tema y un idioma Esto puede desencadenar tres tipos de eventos gt Si no existe un corpus asociado al tema e idioma elegidos el sistema muestra un di logo de error como el de la Figura 9 gt Si no existe una ontolog a creada para ese tema y ese idioma el sistema muestra un di logo como el siguiente Es neceario lanzar la clasificaci n Figura 15 error lanzar la clasificaci n gt Si todos los datos son correctos y se muestra el conjunto de ontolog as que existen para ese tema e idioma el usuario deber elegir una de ellas Una vez elegida se activa el bot n de Lanzar Consulta y el usuario puede introducir una consulta 1 Estas ontolog as ser n las que se han generado anteriormente en la clasificaci n por t rminos Adquisici n semi autom tica del conocimiento una arquitectura preliminar 29 manual del usuario MENU PRINCIPAL po ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO Corpus B squedas Contiguracion Busquedas Por T rminos Por T rminos Fy P Por Dependencias re Elige un corpus economia x Elige un idioma Elige un archivo frances w fastr_fr acabit w Introduce la consulta Lanzar Consulta
20. iento una arquitectura preliminar 11 manual de instalaci n gt A continuaci n es necesario descomprimir el archivo tar xzvf archivo tar gz gt Por ltimo es necesario actualizar la variable ANT_HOME con el valor usr local ant as como la variable JAVA HOME con el valor usrl local jdk Estas variables al igual que ocurr a con el jdk se pueden actualizar bien en el fichero bashrc del usuario bien en etc profile para todos los usuarios C INSTALACI N DE LA LIBRER A DOT Para esta operaci n es necesario utilizar el comando apt get para ello se escribe en la consola apt get install springgraph D INSTALACI N DE LA LIBRER A TWIG Para esta operaci n es necesario utilizar el comando apt get para ello se escribe en la consola apt get install libxml twig perl No se describe cual es el proceso de instalaci n de TreeTagger Fastr Acabit y Erial Esto es as porque debido a las modificaciones que se han hecho de estas herramientas ya est n incluidas en la distribuci n del disco que acompa a a la documentaci n Se ver a continuaci n que las mismas ya est n incorporadas en la estructura de ficheros y solamente ser necesario realizar ciertas modificaciones en el fichero etc profile De cualquier forma consultando las referencias de la web se pueden encontrar los sitios donde poder descargar estas herramientas En estas p ginas se describe el proceso de instalaci n que puede ser de inter s para el us
21. iza a 1 6579 francos suizos frente 1 67 fi La divisa helvetica se repleg primero al principio de la sesi n afectada por las propuestas del presidente de Banque Los mercados a veces no nos toman en serio y es importante demostrarles que lo somos ha insistido Un debilitamiento del franco suizo cerca de sus m s altos niveles del a o podr a pasar por una bajada de los tipos El BNS no es el nico en rechinar sobre el valor de su moneda El ministro de Hacienda P blica japonesa Masajuro Shiokawa en la ma ana ha abiertamente recordado a los opera Estas propuestas han impedido a la divisa nipona franquear en baja la barrera de los 130 yenes por d lar haci ndo at malas cifras de empleo americano y la reca da de Wall Street han llevado a los mercados obligacionistas al alza en 4 Il Figura 18 vista de un documento Adquisici n semi autom tica del conocimiento una arquitectura preliminar 31 manual del usuario 2 4 2 B SOUEDA POR DEPENDENCIAS En primer lugar ser necesario elegir un tema y un idioma Esto puede desencadenar tres tipos de eventos gt Si no existe un corpus asociado al tema e idioma elegidos el sistema muestra un di logo de error como el de la Figura 9 gt Si no existe una ontolog a creada para ese tema y ese idioma el sistema muestra un didlogo de error como el de la Figura 15 No se vuelve a detallar c mo se muestran los documentos pues esa operaci n ya
22. l nombre de estos documentos es en realidad un enlace que al pulsarlo muestra el contenido del documento tal y como se puede ver en la Figura 18 Es necesario indicar que si bien en la recuperaci n de documentos por t rminos no se realiza la busqueda en mas de un idioma la vista es la misma pero s lo incluir a una pesta a de idioma A modo de ejemplo en la Figura 17 para el caso de la b squeda por t rminos si la b squeda ha sido para el espa ol s lo se mostrar a la pesta a correspondiente a ese idioma Documentos x ARQDITELTURA DE ADQUISICION DE CONOCIMENTO Ceconomia36_va EL BILLETE YERDE SE MANTIENE BAJO PRESI N a La moneda nica europea ha alcanzado ayer durante la sesi n el nivel de 0 8849 d lares El billete verde ha sufrido malas estad sticas hebdomadarias para el empleo y la reca da del conjunto de los mercado Privados de estad sticas econ micas desde el principio de la semana y a la espera de la publicaci n esta tarde de la No s lo el n mero de demandantes de subsidio 438 000 ha sido m s elevado que el previsto la semana pasada Estos datos deben ser manejados con prudencia ya todavia pueden oscilar debido a una reciente reforma de la ley a Esto no ha impedido a los cambistas sancionar la divisa americana Apuntado en 0 88 d lares unos cuantos minutos antes el euro ha inmediatamente remontado a 0 8849 d lares ja Estas malas noticias han hecho descontrolar al d lar frente a la moneda su
23. la forma de la palabra El retorno debe ser una cadena Adquisici n semi autom tica del conocimiento una arquitectura preliminar 43 manual del usuario o getLema Devuelve el lema de la palabra El retorno debe ser una cadena Existe en el sistema una implementaci n de esta interfaz se llama TaggerData Implementa los m todos descritos Tiene tres atributos que son label forma y lema El constructor inicializa esos valores TaggerData String forma String label String lema En cuanto a las dependencias generadas se debe crear un ArrayList de tipo Dependency Esta interfaz proporciona los siguientes m todos o getLabel Devuelve la etiqueta asociada a la dependencia El retorno debe ser una cadena o getLemal Devuelve el lema de la primera palabra de la dependencia El retorno debe ser una cadena o getPosl Devuelve la posici n en la frase de la primera palabra de la dependencia El retorno debe ser una cadena o getLema2 Devuelve el lema de la segunda palabra de la dependencia El retorno debe ser una cadena o getPos2 Devuelve la posici n en la frase de la segunda palabra de la dependencia El retorno debe ser una cadena Por lo tanto las dependencias que devuelve el an lisis sint ctico deben ser pares de palabras con la posici n de cada una en la frase actual y la etiqueta asociada a la dependencia Existe en el sistema una implementaci n de la interfaz Dependency es la clase DependencyData Implementa
24. lizador a adido es erialFR se alado en negrita el usuario deber acceder al nodo parser con lang fr A continuaci n a adir un nodo de tipo analyzer con un atributo name que sea el nombre del analizador Este nombre debe ser nico en el sistema En el nodo rutaParser se definir la ruta donde se ubica el analizador si ste es un recurso externo En el nodo claseParser es necesario indicar el nombre de la clase que ejecuta el analizador Es muy importante indicar el paquete entero donde se encuentra la clase Adquisici n semi autom tica del conocimiento una arquitectura preliminar 45 INDICE DE FIGURAS indice de figuras A INDICE FIGURAS Figura 1 entrada a la aplicaci n dies 17 Figura 2 elegir un fichero de configuraci n ooococcoccccncnnoncnnnnanan nana na eee e nena ene 18 Figura 3 error en la estructura del fichero de configuraci n seen 18 Figura 4 elementos repetidos en el fichero de configuraci n seen 19 FIGURA Ss men principal een ao arias 19 Figura 6 error idioma sin recurso asociado an ers 20 Fig ra 7 Mista Generation alaei ku A E ao ok ab ua 21 Figura 8 vista principal de clasificaci n por t rmiN0S 2 22 Figura 9 error no existe COFPDUS ccce 23 Figura 10 aviso clasificaci n por t rM NOS c 23 Figura 11 vista clasificaci n por t rminos crear la ontolog a 24 Figura 12 vista principal clasificaci n por dependencias eens eee 25 Figura 13 aviso clasificaci n p
25. n Por Terminos Por Dependencias Por T rminos Elige un corpus economia w Elige un idioma Elige los extractores W fastr_es espanol w C gamallo Lanzar Extracci n Figura 8 vista principal de clasificaci n por t rminos 22 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario Para realizar la clasificaci n por t rminos en primer lugar es necesario lanzar la extracci n de t rminos De este modo el usuario debe introducir el tema e idioma se pueden dar tres casos gt Si el idioma no tiene ning n extractor asignado el sistema mostrar una caja de di logo similar a la Figura 6 donde se indicar que el idioma no tiene ningun extractor asignado Si no existe ningun corpus asociado al idioma y al tema el sistema muestra una caja de di logo como la siguiente El corpus no esta creado Figura 9 error no existe corpus El idioma tiene al menos un extractor asignado el sistema muestra esos extractores En ese momento el usuario puede elegir el extractor con l que desea trabajar puede elegir mas de un extractor a la vez Una vez elegido el extractor o extractores puede pulsar el bot n Lanzar Extracci n Entonces se le muestra una caja de di logo inform ndole de la operaci n que ha solicitado El usuario deber confirmar dicho di logo para proceder a la extracci n A Se va a proceder a la CLA
26. n de conocimiento MENU PRINCIPAL gt lt ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO Corpus B squedas Configuraci n Configuraci n ESPA Dedararcorp s MEM Herramientas y E Idioma AS Idioma Nuevo Borrar Idioma Nombre del Idioma Elige un Idioma Abreviatura del Idioma al Utiliza StopWords Os O NO v Figura 22 vista gesti n idioma En la figura anterior se muestran dos formularios El de la izquierda permite a adir un nuevo idioma y el de la derecha borrar un idioma A ADIR UN IDIOMA El usuario puede solicitar a adir un nuevo idioma para ello accede al formulario de la izquierda En primer lugar deber escribir el nombre del idioma as como el nombre de la abreviatura asociada En ltimo lugar elegir si va a trabajar con un fichero con palabras de parada Una vez proporcionados todos los par metros y pulsado el bot n IdiomaNuevo pueden desencadenarse tres eventos gt Si el nombre del idioma introducido ya existe en el sistema el sistema informa de ello con una caja de di logo como la de la Figura 20 en la que se indicar que el idioma est repetido Adquisici n semi autom tica del conocimiento una arquitectura preliminar 35 manual del usuario gt Si el nombre de la abreviatura ya existe en el sistema el sistema informa de ello de la misma manera que en el punto anterior gt Si todos los par metros son correctos
27. nalizado una vez que se muestre el bot n Lanzar Ontologia Adquisici n semi autom tica del conocimiento una arquitectura preliminar 25 manual del usuario Adguisici n de conocimiento MENU PRINCIPAL x AROQUITECTURA DE ADQUISICION DE CONOCIMIENTO Corpus B squedas Configuraci n Corpus Generaci n Clasificaci n I Clasificaci n o Por Terminos Por Dependencias Por Dependencias Elige un corpus Elige un idioma Lanzar Ontolog a Figura 14 vista clasificaci n por dependencias crear la ontolog a El usuario deber pulsar el bot n Lanzar Ontolog a para generar la ontolog a por dependencias Una vez se ha creado la ontolog a sta puede recuperarse en el directorio Ontologia temaActual idiomaActual ontologia donde temaActual e idiomaActual son respectivamente el tema e idioma que el usuario ha elegido A INTERACCI N DEL USUARIO CON LOS FICHEROS Una vez el proceso se ha ejecutado el usuario podr a volver a lanzarlo para obtener nuevos resultados que sean m s acordes a sus necesidades Para ello puede modificar un conjunto de ficheros estos ficheros est n descritos en el apartado 13 2 del Manual T cnico Los ficheros se recuperan del directorio Ontolgia recuperacionConocimiento temaActual dentro del directorio donde est instalada la aplicaci n 26 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del u
28. on existen dos carpetas Extract y Analyzer Ambas carpetas contienen respectivamente los extractores y los analizadores sint cticos concretos utilizados Estar n listos para funcionar en el momento en l que se los referencie en el fichero etc profile Es necesario publicarlos en dicho fichero para que la m quina virtual java sea capaz de localizarlos En dicho fichero se a adir Adquisici n semi autom tica del conocimiento una arquitectura preliminar 13 manual de instalaci n export PERL5LIB home usuario conocimiento distribucion Extract frances Acabit Flemm PATH home usuario conocimiento distribucion Extract frances FastrFr fastr bin PATH PATH home usuario conocimiento distribucion Extract Tagger cmd PATH export PATH home usuario conocimiento distribucion Extract Tagger bin PATH Se describe a continuaci n el significado de lo a adido al fichero La primera variable PERL5LIB es necesaria para la ejecuci n de Acabit A la variable PATH en primer lugar se le a ade la referencia a Fastr esto lo utilizar n tanto la versi n en espa ol como la versi n en franc s A continuaci n se a ade la referencia al etiquetador TreeTagger En cuanto a las clases que implementan cada una de estas herramientas ya est n incluidas por defecto en la distribuci n Si se decide utilizar estas herramientas ser necesario aportar la informaci n correspondiente en el fichero de
29. or dependencias 25 Figura 14 vista clasificaci n por dependencias crear la ontologia 26 Figura 15 error lanzar la clasificaci n u n an een een 29 Figura 16 b squeda por fermings an 30 Figura 17 resultado de los doCUMentOS oa 30 Figura 18 vista de un documento xor fr bi 31 Figura 19 vista gesti n tendieren 33 Adquisici n semi autom tica del conocimiento una arquitectura preliminar 49 indice de figuras Figura 20 error tema repetido ui crc sauna en nasse 34 Figura 21 aviso eliminar UN ClEMENCO ccc ccc ece cece cece ee eee eeeeee esas nnnn ernennen 34 Figura 22 vista gesti n domain near da a Ra 35 Figura 23 vista gesti n EXC skore erin sa ode d o 37 Figura 24 error en la clase introducida cece eee nennen nun nennen nen 38 Figura 25 vista GeSstionsandlizad Ors ssl 39 50 Adquisici n semi automatica del conocimiento una arquitectura preliminar
30. roducido el fichero se debe pulsar la tecla OK Se podr n producir a continuaci n los siguientes tres eventos gt Si el fichero de configuraci n no es v lido el sistema mostrar un di logo como el siguiente x El fichero de configuracion es incorrecto Figura 3 error en la estructura del fichero de configuraci n 18 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario gt Si el fichero de configuraci n tiene nodos repetidos el sistema mostrar un di logo como el siguiente El fichero de configuracion tiene valores repetidos en el NODO idioma Figura 4 elementos repetidos en el fichero de configuraci n gt Si el fichero de configuraci n es correcto el sistema activar el menu principal mostrando una vista como la siguiente Adguisici n de conocimiento MENU PRINCIPAL x ARQUITECTURA DE ADQUISICION DE CONOCIMIENTO fi TE T Corpus B squedas Configuraci n Figura 5 men principal Adquisici n semi autom tica del conocimiento una arquitectura preliminar 19 manual del usuario 2 2 VISTA CORPUS Se van a describir las operaciones en la secuencia l gica en la que deber an de ser hechas si se estuviese trabajando con elementos nuevos en el sistema es decir si se est procediendo con un tema e idioma reci n introducidos 2 2 1 GENERACI N Una vez se haya introducido el fichero de configuraci n correctamente la vista
31. suario FICHERO ELEM TXT En el mismo se pueden modificar los nombres asignados a los conceptos y propiedades Sin embargo deben permanecer MERCADOS y PROPIEDADES MERCADOS ENTIDADES INDICES DINEROS PAISES PERSONAS PROPIEDADES LUGARES TIPOS TAMANO PER ODO CATEGOR A Es necesario a adir una tabulaci n antes de cada concepto y propiedad FICHERO MARCADORES TXT En este fichero se definen aquellas palabras que marcan el tipo de relaci n entre los elementos de una dependencia bolsa MERCADOS PAISES INDICES 2 bolsa PROPRIEDADES LUGARES TIPOS 2 mercado PROPIEDADES LUGARES TIPOS 2 mercado MERCADOS INDICES DINEROS 2 tamano PROPRIEDADES TAMANO 2 gestion MERCADOS ENTITES DINEROS 1 2 gestion PROPIEDADES TIPO TAMANO LUGARES 2 inicio PROPRIEDADES PERIODO 2 Cada linea del mismo define un marcador En la primera columna hay que poner la palabra marcador A continuaci n el elemento con l que se puede relacionar bien un concepto designado por MERCADOS o bien una propiedad designada por PROPIEDADES En tercer lugar el tipo del concepto o propiedad seg n el valor de la columna anterior Por ltimo se a ade un n mero entre corchetes indicando la posici n en la dependencia del elemento que acompa a al marcador Todos los valores deben separarse por tabulaciones Adquisici n semi autom tica del conocimiento una arquitectura preliminar 27 manual del usuario FICHERO PROPIEDADES TXT
32. t Si todos los valores son correctos el sistema a ade el nuevo analizador y se muestra un mensaje de xito A partir de ese momento el analizador esta disponible para las tareas oportunas BORRAR UN ANALIZADOR SINTACTICO En el caso de que el usuario desee borrar un analizador sintactico debera seleccionar en el formulario de la derecha el analizador que desea eliminar Al igual de como suced a con los extractores se muestra una ventana de confirmaci n en la que se informara de que se van a eliminar todas las referencias del analizador en el fichero de configuraci n Al igual que sucede con los extractores no se eliminar n los directorios asociados 40 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario 3 MANUAL DEL USUARIO EXPERTO Se ha comentado en el Manual T cnico apartado 3 especificaci n de requisitos que la aplicaci n puede ser utilizada por dos tipos de usuarios La interfaz gr fica puede ser manejada por cualquiera de ellos pero si lo que se pretende es modificar la aplicaci n sin utilizar la misma son necesarios algunos conocimientos a mayores Dichos conocimientos se considera que los posee el usuario llamado experto Se describe aqu c mo el usuario experto debe implementar las clases que realicen bien la extracci n bien el an lisis sint ctico Se detalla el comportamiento esperado de los m todos que desarrollen as como la descripci n de las modificaciones
33. tor esta repetido gt Si la clase introducida contiene errores se muestra el siguiente di logo x Existe un error en la clase introducida Figura 24 error en la clase introducida gt Si todos los valores son correctos el sistema a ade el nuevo extractor y se muestra un mensaje de xito A partir de ese momento el extractor est disponible para las tareas oportunas BORRAR UN EXTRACTOR En el caso de que el usuario desee borrar un extractor deber seleccionar en el formulario de la derecha el extractor que desea eliminar Al igual de como suced a con los idiomas y los temas se muestra una ventana de confirmaci n pero en este caso se informar de que se van a eliminar todas las referencias del extractor en el fichero de configuraci n Se ha optado por no eliminar los directorios que contienen a los extractores caso de que estos se implementen como un recurso externo 38 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual del usuario 2 5 4 GESTION DE ANALIZADORES SINT CTICOS La gesti n de los analizadores sint cticos se lleva a cabo a trav s de la siguiente vista F A FF po y Adquisici n de conocimiento MENU PRINCIPAL x ARQUITECTURA DE ADOUISICION DE CONOCIMIENTO s Corpus B squedas Configuraci n Configuraci n js Herramientas ME Herramientas y Extractor Analizador ji soe Analizador a Analizador Nuevo Borrar Analizador Elige un idioma Elig
34. uario si desea hacer una prueba de las mismas con su funcionamiento est ndar En el caso de Erial no se proporciona ninguna fuente de descarga pues no es una herramienta de c digo libre 12 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual de instalaci n 1 3 INSTALACI N DE LA APLICACION En el disco que acompa a la documentaci n existe un directorio llamado programa que el usuario deber copiar al directorio en l que desee instalar la aplicaci n gt Si se supone que el directorio de instalaci n va a ser home usuario conocimiento copiamos en su interior el contenido de la carpeta gt A continuaci n procesamos los fichero con ant por lo que se escribe en l nea de comandos ant AdConocimiento gt El programa en estos momentos ya est instalado Ahora es necesario actualizar la variable CLASSPATH En primer lugar se a ade a la variable el directorio donde se sit an los archivos del programa instalado es decir CLASSPATH home usuario conocimiento distribucion bin gt A continuaci n se a aden a la variable todos los ficheros situados en home usuario conocimiento lib Por ejemplo CLASSPATH home usuario conocimiento lib lucene core 2 1 0 j ar CLASSPATH gt Una vez hecho esto accediendo a home usuario distribucion se puede ejecutar el script que lanza la aplicaci n AdConocimiento sh gt En el directorio home usuario conocimiento distribuci
35. ura preliminar 9 manual de instalaci n gt Maquina Virtual J ava jdk 1 5 gt Herramienta ANT para la compilaci n e instalaci n del programa gt Libreria dot Es una libreria para crear grafos jer rguicos Permite generar los gr ficos utilizados al mostrar los nodos de la ontolog a 1 2 2 REQUISITOS ESPEC FICOS Se describen en este apartado cuales son los requisitos para las herramientas proporcionadas al sistema en el desarrollo del caso concreto gt Compilador de PERL por normal general este compilador ya viene incluido en las distribuciones de Linux gt Twig que es un m dulo PERL para analizar fichero XML gt Etiquetador TreeTagger gt Extractor Acabit gt Extractor Fastr gt Analizador sint ctico Erial 1 2 3 INSTALACI N DE LOS PROGRAMAS NECESARIOS En el disco proporcionado con la documentaci n se encuentra todas las herramientas necesarias para instalar el sistema salvo el propio sistema operativo y las liber as twig y dot que se instalar n con el comando apt get apt es un sistema de gesti n de paquetes software concretamente apt get es el comando utilizado para usar dicho sistema a trav s de la l nea de comandos 10 Adquisici n semi autom tica del conocimiento una arquitectura preliminar manual de instalaci n A INSTALACION DE LA MAQUINA VIRTUAL DE JAVA gt En primer lugar es necesario descargar el jdk del sitio web de SUN http java sun com j2se Si se trabaja bajo Debi
36. xtractor Devuelve el extractor que ha dado lugar al t rmino El retorno es una cadena El usuario deber guardar los resultados de la extracci n en un ArrayList de tipo RdoTerminos Con el constructor se inicializan los valores de los atributos gt getTerminos Este m todo devuelve el vector de tipo RdoTerminos anteriormente descrito En cuanto al fichero de configuraci n es necesario acceder al nodo correspondiente a los extractores lt extractores gt lt ext lang es gt lt extractor name fastr_es gt lt rutaExtract gt Extract espanol FastrEs lt rutaExtract gt lt clase gt universidad proyecto recursos extractor FastrES lt clase gt lt extractor gt lt ext gt lt ext lang fr gt lt extractor name fastr_fr gt lt rutaExtract gt Extract frances FastrFr lt rutaExtract gt lt clase gt universidad proyecto recursos extractor FastrFR lt clase gt lt extractor gt lt extractor name acabit gt lt rutaExtract gt Extract frances A cabit lt rutaExtract gt lt clase gt universidad proyecto recursos extractor Acabit lt clase gt lt extractor gt lt ext gt lt extractores gt 42 Adquisici n semi automatica del conocimiento una arquitectura preliminar manual del usuario En primer lugar hay que seleccionar el idioma asociado al extractor para ello se introducir el nodo correspondiente al extractor bajo el nodo ext cuyo atributo lang sea la abreviatura del idioma elegido Si
Download Pdf Manuals
Related Search
Related Contents
DOSYS 162/163/164/172/173/174 moisture.IQ - GE Measurement & Control PRO SUPERPRIME™ - Tri Wizard CMB-570 - Commell RUE-4191 HOME THEATER SURGE PROTECTOR JP 800G R LOCK - Raceseng Document EREP User Guide Copyright © All rights reserved.
Failed to retrieve file