Home

Document - XLDB - Universidade de Lisboa

image

Contents

1. cccceeetesseseeteeeeeeeees 48 Figura 40 Formul rio que permite a inser o de novos compostos org nicos 49 Figura 41 Diagrama de Colabora o do Caso de Uso Inserir um composto 50 V Figura 42 Caixa de pesquisa por ID molecular de um composto a apagar 52 Figura 43 Formul rio de actualiza o dos dados dos compostos existentes 53 Figura 44 Informa o sobre o composto a remover da base de dados 54 Figura 45 Funcionalidade para a monitoriza o dos utilizadores registados 56 Figura 46 Estat sticas da base de dadoS cccccccccsssssssssessseeeeeecceeeeeeeeeeeeeaaaseeeeseseeees 56 Figura 47 Interface que permite a monitoriza o do uso das funcionalidades 57 Figura 48 Conte dos do manual de instru es do sistema Therminio 58 Figura 49 Conte dos do manual de instru es do sistema Thermlnfo 000006 59 Figura 50 Formul rio para o envio de mensagens aos administradores 60 Figura 51 Representa o gr fica das estat sticas da Base de Dados 62 Figura 52 Avalia o dos prot tipos de Baixa Fidelidade cc ccceeseeseeeeeeeeeees 65 Figura 53 Verifica o do c digo HTML num sistema de valida o do W3C 66 Figura 54 Apresenta o de mensagens adequadas para transmitir erros
2. Administration Type only numerical characters Ignore letters and special characters Contact Us You are searching for methanol Number of compounds found 16 1 Molecular ID CODOL64 Compound Name Methanol Molecular Formula CH40 CAS registry number 67 56 1 SMILES CO More info 2 Molecular ID CO01398 Compound Name 2 Furanmethanol Molecular Formula CcH O gt CAS registry number 98 00 0 SMILES OCcicccol More info 3 Molecular ID Co02022 Compound Name Benzenemethanol Molecular Formula C7Hg0 CAS registry number 100 51 6 SMILES OCciccecel More info 4 Molecular ID co02024 Compound Name Biphenylmethanol Molecular Formula 13H120 CAS registry number 41376 19 6 SMILES OCcicececic ccccc More info View 5 Molecular ID Ccoo0307 Compound Name Dioxybismethanol Figura 34 Parte da listagem de resultados obtida para a pesquisa de compostos com o nome methanol A totalidade da informa o sobre cada um dos compostos pode ser visualizada clicando em View abrindo se uma nova janela Figura 35 de forma a manter vis vel a p gina com a listagem de resultados 44 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Tuesday uy 212000 a 4 Hydroxy 2H pyran 3 3 5 5 4H 6H tetramethanol O HO OH HO OH OH Molecular ID CO01689 Compound 4 Hydroxy 2H pyran 3 3 5 5 4H 6H tetram
3. 68 6 65 3 Desvio Padr o 21 4 20 1 14 5 21 8 N de erros 0 4 0 3 0 3 0 3 0 3 0 2 0 6 0 3 0 4 Desvio Padr o 0 7 0 6 0 4 0 5 0 5 0 4 1 0 0 6 0 5 Facilidade 0 5 4 1 4 0 4 3 Memorizacao 0 5 4 4 4 5 4 2 Satisfa o 0 5 4 1 4 1 4 0 I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 relativa pesquisa simples Tarefa 2 relativa pesquisa estrutural Tarefa 3 relativa inser o de dados 15 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Seguidamente apresentam se um conjunto de Box Plots Figura 57 que nos permitem relacionar visualmente os valores de tempo que os utilizadores de cada um dos grupos demoram a realizar cada uma das tarefas com v rias medidas estat sticas nomeadamente no que diz respeito dispers o e distribui o do conjunto de dados dentro e entre grupos Tempo segundos Grupo de Utilizadores Figura 57 Representa o gr fica utilizando Box Plots da vari vel tempo necess rio para realizar cada tarefa para cada um dos grupos de utilizadores I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 pesquisa simples Tarefa 2 pesquisa est
4. ccceeeeeeeeeeees 80 viii Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Introdu o While much bioscience is published with the knowledge that machines will be expected to understand at least part of it almost all chemistry is published purely for humans to read Murray Rust 1 1 Enquadramento Em grande parte a Qu mica continua a ser uma ci ncia emp rica desenvolvendo uma crescente quantidade de dados e informa o A informa o qu mica quantific vel cresce exponencialmente devido ao constante refinamento e optimiza o das tecnologias experimentais 1 De acordo com o Chemical Abstracts Service CAS actualmente existem mais de 35 milh es de compostos qu micos conhecidos CAS Statistical Summary http www cas org ASSETS 836E38041 11 B49BFA28B95BD1B40CDOF casstats pdf Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas aumentando mais de 1 milh o todos os anos Em termos de literatura mais de 1 milh o de publica es por ano est o relacionadas com informa o qu mica Figura 1 2 Por este motivo o desenvolvimento das Tecnologias de Informa o aplicadas Informa o qu mica essencial e torna poss vel a manipula o de grandes quantidades de dados dinamiza os processos de procura partilha e obten o de informa o e ainda a aplic
5. o sec o de ajuda deste tipo de pesquisa Figura 30 Sa ea CASRN format NNNNNNN NN N 1 7 digits hyphen 2 digits hyphen 1 digit Help Figura 30 Formulario da Pesquisa Simples por CASRN particularidade da Figura 24 Search 123 2 1 CASRN y CASEN format NNNNNNN NN N 1 7 digits hyphen 2 digits hyphen 1 digit Help 84XL8M Type only numerical characters Ignore letters and special characters Security code Invalid CAS registry number format 123 2 1 Make sure the CAS registry number you have entered matches the standard format NNNNNNN NN N 1 7 digits hyphen 2 digits hyphen 1 digit Figura 31 Mensagem de erro retornada numa pesquisa com o formato do CASRN errado Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Search 1253 224 CAS BM y CASRN format NNNANWAN NAAN 1 7 digits hyphen 2 digits hyphen 1 digit Help Type only numerical characters Ignore letters and special characters Security code Invalid CAS registry number 123 22 1 It does not verify the check digit Figura 32 Mensagem de erro retornada numa pesquisa com um CASRN errado A verifica o da validade do CASRN feita baseada no d gito de controlo Na pesquisa por SMILES o utilizador dever inserir o SMILES do composto tendo em conta que existe uma diferen a entre letras mai sculas e mi
6. o sec o de ajuda deste tipo de pesquisa Figura 29 Search C12362 Molecular ID Molecular ID format CONNNNN MANN 5 digits Help Security code Type only numerical characters Ignore letters and special characters Invalid Molecular ID C12362 Make sure the Molecular ID you have entered matches the correct format CONNNNN CO and 5 digits Figura 28 Mensagem de erro retornada numa pesquisa com o formato do ID molecular errado Molecular ID format CONNAN MANN 5 digits Help Figura 29 Formul rio da Pesquisa Simples por ID molecular particularidade da Figura 24 Na pesquisa por CASRN o utilizador dever inserir o CASRN do composto de acordo com o seu formato NNNNNNN NN N 1 7 2 d gitos h fen 2 d gitos h fen 1 d gito Quando a pesquisa submetida antes da procura do termo inserido na base de dados feita nao sO uma verifica o a este formato como ao d gito de 4 Cap tulo 3 Metodologia e Implementa o 42 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas controlo Cap tulo 2 Caso o formato n o seja o correcto ou n o se verifique o d gito de controlo correcto ser retornada uma mensagem que informa o utilizador Figura 31 e 32 Em termos de interface quando o tipo de pesquisa CASRN seleccionado apresentada uma instru o de pesquisa que indica o formato do CASRN assim como uma liga
7. o de dados termoquimicos Para isso encontra se dividido em 4 fases de desenvolvimento Figura 4 interdependentes e complementares para que as funcionalidades e a Interface sejam adequadas s tarefas e s capacidades dos investigadores na rea da termoquimica 7 8 1 Percep o formulado e analisado o problema e s o delineadas solu es com base em an lises de requisitos dos utilizadores e do sistema Esta an lise inclui entrevistas a potenciais utilizadores em que s o discutidas as suas necessidades e problemas na manipula o de dados termoqu micos 2 Concep o S o geradas e avaliadas solu es modelando o sistema e s o feitas as escolhas das solu es mais apropriadas Para isso s o desenvolvidos e avaliados prot tipos de baixa fidelidade e diagramas de classes utilizando Unified Modeling Language UML que modelam as funcionalidades do sistema 3 Implementa o implementada a solu o escolhida na fase anterior Os dados s o armazenados numa base de dados My Structured Query Language MySQL com uma arquitectura adequada aos dados estruturais e termoqu micos As funcionalidades de pesquisa inser o e gest o dos dados s o realizadas atrav s de uma interface Web implementada em Hypertext Preprocessor PHP Java Script JS HyperText Markup Language HTML e Cascading Style Sheets CSS MySQL http www mysql com gt PHP http www php net Capitulo 1 Intro
8. o deste Sistema de Informa o para coligir e apresentar propriedades estruturais e termoqu micas de compostos org nicos de acordo com as expectativas funcionais esperadas e com aplicabilidade na actividade de investiga o de forma a agilizar este processo especialmente quando est o envolvidas grandes quantidades de informa o As contribui es deste projecto s o o ponto de partida para a expans o pela comunidade cient fica do conjunto de dados disponibilizado tal como a incorpora o de novas funcionalidades que poder o conduzir ao aperfei oamento do sistema Ao longo do desenvolvimento deste projecto novas frentes foram abertas que n o tendo sido poss vel incluir neste trabalho poder o constituir direc es futuras que ir o ampliar as capacidades do sistema Therminfo Destacam se como exemplos o estender a compila o de dados de compostos org nicos a inorg nicos organomet licos e radicais a Incorpora o de ferramentas quimio inform ticas tais como o JChemPaint para desenhar estruturas quimicas e combina las com termos de consulta textuais de forma a restringir as pesquisas e o OpenBabel para converter uma string SMILES em outros formatos de estrutura qu mica a Incorpora o de outros m todos de pesquisa tal como por semelhan a entre SMILES utilizando fingerprints 1 JChemPaint http apps sourceforge net mediawiki cdk index php title JChemPaint 20 OpenBabel http op
9. Mover a m o para o teclado H 18 Prepara o Mental M 19 Digitar o c digo de seguran a 6K 20 Mover a m o para o rato H 21 Prepara o Mental M 22 Mover o cursor at ao bot o Search P 23 Clicar no bot o Search B 24 Resposta do sistema R 0 18 segundos 25 Prepara o Mental M 26 Mover o cursor at ao composto pretendido P 27 Clicar no bot o View B 28 Resposta do sistema R 0 14 segundos Para calcular o tempo de execu o esperado foram substitu dos os comandos pelos tempos estimados para a sua execu o Tabela 2 Obteve se texecu o 0 4 1 35 1 1 0 2 1 35 1 1 0 4 1 35 6 0 28 0 4 1 35 1 1 0 2 1 35 1 1 0 2 0 4 1 35 6 0 28 0 4 1 35 1 1 0 2 0 18 1 35 1 1 0 2 0 14 24 08 segundos Objectivo Realizar uma pesquisa estrutural para encontrar o composto com Nome do composto methylene Peso molecular superior a 30 Estado f sico crystal Caracter stica polymer Capitulo 4 Avalia o 70 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Accoes 1 Mover a m o para o rato H 2 Prepara o Mental M 3 Mover o cursor do rato at Structural Search P 4 Carregar no bot o do rato B 5 Prepara o Mental M 6 Mover o cursor at caixa do nome do composto P 4 Carregar no bot o do rato B 7 Mo
10. digo de liga o entre os dados estruturais 1 e os dados termoqu micos 2 e as setas a cinzento indicam o c digo de liga o entre os dados termoqu micos 2 e as refer ncias 3 e Capacidade e performance medida que o conjunto de dados aumenta a efici ncia do uso das folhas de c lculo vai decrescendo devido quantidade de mem ria necess ria Dado o n mero de compostos qu micos existentes previs vel que o conjunto de dados aumente muito tornando se incomport vel o uso deste tipo de formato de armazenamento e consulta e Multiuso e partilha de dados pela comunidade cient fica com diferentes privil gios o multiuso do conjunto de dados utilizando as folhas de c lculo requer muita disciplina e aten o especialmente se o grupo de pessoas for extenso podendo o mesmo ser facilmente corrompido N o poss vel restringir os utilizadores de aceder e ou modificar determinadas informa es Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e Evolu o a utiliza o das folhas de c lculo dificulta a evolu o do conjunto de dados atrav s de novas integra es e a aplica o de m todos de previs o de propriedades ou de outros tipos A partir destas premissas e com vista a encontrar uma solu o para as mesmas foi estruturada a proposta deste trabalho a implementa o de um Sistema de Informa o para coligir e apresentar
11. execu es base de dados e encontram se especificados na Tabela 1 62 Cap tulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Tabela 1 Tempo em segundos utilizado para as queries realizadas para pesquisar um composto e inserir dados no conjunto de dados actual Funcionalidade Pesquisa simples por nome por exemplo methanol Pesquisa estrutural com base em Compound propane Molecular weight gt 50 Physical state Liquid Class Ring Systems Containing Isolated Benzenoid and Non Benzenoid Rings Characteristics Alkane Arene Inserir um novo composto com todos os par metros relativos a propriedades estruturais e termoqu micas preenchidos e uma refer ncia Queries SELECT mid mol 1d casrn name formula smile instr name methanol as fpos FROM molecule WHERE molecule name LIKE Y methanol order by fpos name LIMIT 100 1 SELECT molecule FROM mol char WHERE charact IN I 4 GROUP BY molecule HAVING COUNT gt 2 2 SELECT molecule mid molecule mol id molecule casrn molecule name molecule formula molecule smile FROM molecule class WHERE molecule mid IN 2531 2532 2533 2534 2535 2536 2584 2585 2586 2587 2840 2841 2842 2843 2844 2845 2846 2847 2848 2850 2883 2884 2886 2887 2888 2889 2890 2892 2893 2895 2896 2897 2947 2948 2949 2950 2951 2952 2953 AND molecule name
12. 23 Posteriormente devemos garantir que a informa o correcta n o seja alterada intencionalmente ou acidentalmente e dificultar o uso de software malicioso que tenha como objectivo fazer spam ou copiar o conjunto de dados S determinados utilizadores autorizados podem ter acesso aos dados informa o para os alterar corrigir e que a interface deve ser adequada tarefa f cil de usar e oferecer ajuda aos utilizadores com tutoriais exemplificativos de forma a minimizar os eventuais problemas com a utiliza o de Tecnologias de Informa o e diminuir o tempo de aprendizagem necess rio e que a Interface deve tamb m ser simples e focada no objectivo ja que os utilizadores n o t m muito tempo dispon vel A apresenta o de muita Informa o muitas vezes irrelevante ir exigir mais tempo para desempenhar as tarefas e a extensibilidade a adi o ou modifica o de funcionalidades n o deve interferir com o funcionamento das restantes e a capacidade de aumentar o conjunto de dados armazenados atrav s dos contributos de utilizadores registados no sistema sujeitos a posterior valida o por parte dos administradores e a manuten o com a realiza o de backups autom ticos do conjunto de dados e funcionalidades administrativas adequadas Assim as principais funcionalidades Figura 5 requeridas podem ser divididas em duas grandes classes 1 Pesquisar compostos utilizando um dos dois m todos disp
13. 67 Figura 55 Preven o de erros durante a pesquisa de um composto 67 Figura 56 Avalia o dos prot tipos de Alta Fidelidade ssssseem 74 Figura 57 Representa o gr fica utilizando Box Plots da vari vel tempo 16 Figura 58 Distribui o dos utilizadores pelo n mero de erros cometidos 81 Figura 59 Distribui o dos utilizadores pelas pontua es aos atributos de SADC AdO o ae tee ee DOR ER a 82 vi Vil Lista de Tabelas Tabela 1 Desempenho temporal das queries realizadas para pesquisar um composto e mser Cl ACO G ssa cisiimta io as Eds pie ete ga aj ede na a en A cn Rn 63 Tabela 2 Tempo de execu o para cada um dos comandos utilizados durante a realiza o de tarefas segundo o modelo KLM e crer ererereeeena 68 Tabela 3 Quadro resumo dos tempos de execu o totais para cada uma das tarefas delineadas com base no modelo KLM GOMS ccc erre re raras T Tabela 4 Resultados dos testes de usabilidade 20 0 0 ccceeeeeeeeeeeessseseeseeseesseeeseeeeeens 75 Tabela 5 Valores de p value obtido para cada um dos testes de KS realizados 78 Tabela 6 Valores de p value obtidos para os testes de Levene e t Student 79 Tabela 7 Valores de tempo para desempenhar uma tarefa esperados KLM GOMS e a m dia de tempo obtidas em cada um dos grupos de utilizadores
14. GODRO GEH Pe ES Aopdde Compomd Sede bo Aus E 47 CO00044 16747 25 4 re i tosa Ca BLIDE dp Compomdr ba peiner dao X 48 CO00045 16747 26 5 2 2 4 T1 33 OOOI COMA BARH Apie Compounds oe prene x 43 C000046 9522 34 9 2257 34 cromo CHM pio Ade s suis Alisa T 50 CO000 7 16747 28 7 2 3 3 Tr mu o pa f Er 51 CO00048 1069 53 0 2 3 5 Tr H pects me SPREE Apii Copan Bathe ta pe Pert ey E 52 C000049 16747 30 1 2 447 JE COMO GHH aL acetic Coeds Bpi pba Akr E 53 CO00050 16747 312 33 4 Tf COORG Gi Pa aop Cespe Spiez Akyar x 54 COO00S 16747 32 3 S Ethyk 23 COGI CETA BLAHA Aspe Compound Spdro urboas i x 5 conose sear SEME ap copo BAR Aer Geet meen lt lt Cd TSR Airie Cyin Mah fs foi Ale il x er Comando Sede bent Albers E WHJ opie Composed aa ea aa Akyar E RAHI App Compomdr aa petten Abu GALS App Composdo Ei dA kanie GLISI Appii Cpi Bi ia hi a Akii E GLISI Arpi Cippi Bp a p prii Akiai E AS Boece Ciani pra p baa er WHH Aopie Composed a ea aa aky E ELINI App Ceapa Bed bots Ruan Lt GLISI Appie Coenen Eh css eek Akui GLISI Sopa Capii Sith na Aiii E GALS Applic Cossioendo phr ed Akii E GAAS Aopdic Composed Epoca Aus E WAHI dopdke Composed i GLAS App Composdo a Figura 3 Exemplo das folhas de c lculo a consultar para obter a informa o completa relativamente a um composto Pode verificar se que n o conseguimos ter uma vista completa de todas as linhas e colunas do conjunto de dados As setas a preto indicam o c
15. Home About Us Search Collecting and presenting thermochemical properties c Structural Search Therminfo is a project aiming to develop a chemoinformatics database system for prediction of thermochemical properties It involves a partnership between the Molecular Energetics Group of COB Centro de Quimica e Bioqu mica and LaSIGE Large Scale Informatics Systems Laboratory The chemistry team has considerable expertise on a variety of experimental thermochemical techniques on assessing thermochemical data and on the Insert Data development of prediction methods The informatics team has extensive experience in web systems development in particular biomolecular databases Administration ThermiInfo will develop an information system for collecting and presenting thermochemical properties obtained from critically evaluated experimental data and several estimation methods By using chemically intelligent software it will be possible to obtain a value of a thermochemical property such as a gas phase standard Contact Us enthalpy of Formation or a bond dissociation enthalpy by using as input e g a molecular structure or the name of a compound 4 variety of empirical methods to estimate new values will be implemented These prediction methods will be selected on the basis of their reliability and will cover a wide range of long lived and transient organic inorganic and organometallic molecules in the gas and in condensed phase Future dev
16. LIKE propane AND molecule mw gt 50 AND molecule state T AND molecule class class cid AND classname Ring Systems Containing Isolated Benzenoid and Non Benzenoid Rings DSELECT casrn FROM molecule WHERE casrn 10025 87 3 2 SELECT mol_id FROM molecule order by mid DESC LIMIT 1 3 INSERT INTO molecule VALUES CO02957 mol_id 4 UPDATE molecule SET casrn 10025 87 3 name meth formula C5H6 mw 40 state T smile CCCC usmile CCCC WHERE mol id CO02957 5 SELECT mid FROM molecule order by mid DESC LIMIT 1 6 SELECT cid FROM WHERE name Alkane characteristic 7 INSERT INTO mol char charact VALUES 2957 1 molecule 8 INSERT INTO data idmol crys cerror liq lerror gas gerror phase perror obs VALUES 2957 40 0 40 0 40 0 40 0 exp values Tempo segundos 0 01 0 00 0 01 0 00 0 02 0 00 0 00 0 00 0 00 0 04 0 02 0 04 Tuplos avaliados 5831 40 1 2956 0 1 2957 28 0 0 0 0 Tuplos retornados 16 39435 0 1 0 O 1 1 0 0 0 0 63 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 9 INSERT INTO reference author journal year volume page VALUES JPL Nature 2009 50 70 10 INSERT INTO data ref idmol refid VALUES 2957 3 Analisando os dados da Tabela 1 verifica se que em ger
17. cada uma das tarefas podemos verificar que para a tarefa 1 o grupo Q apresenta um valor de mediana e uma amplitude inferior ao do grupo I para a tarefa 2 os grupos t m um comportamento muito semelhante para a tarefa 3 o grupo I tem um valor de mediana inferior ao do grupo Q no entanto apresenta uma dispers o superior A an lise deste gr fico e dos valores das m dias e desvios padr o apresentados na Tabela 4 permitem verificar que os grupos apresentam um comportamento semelhante relativamente s tr s tarefas No entanto n o podemos desprezar as diferen as encontradas sem confirmar que estatisticamente estas se devem ao acaso e que efectivamente os grupos s o iguais em termos de valor m dio Isto queremos testar se a forma o profissional interfere com o desempenho com que os utilizadores T1 Capitulo 4 Avalia o 78 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas realizam as tarefas na interface Assim ser efectuado o teste estat stico t Student para duas amostras independentes com as seguintes hip teses 25 Ho n o existe diferen a entre as m dias do desempenho em cada grupo uy Uo versus H existe diferen a entre as m dias do desempenho em cada grupo ur uQ No entanto este teste tem como pressupostos que os grupos em an lise sejam provenientes de uma popula o com distribui o Normal e igualdade das vari ncias De modo a av
18. composto 2 Encontre a ficha do composto com Peso molecular superior a 30 Estado f sico crystal Caracter stica polymer Nome do composto methylene Procedimento Esperado O utilizador clica em Structural Search no menu lateral preenche selecciona no formul rio os quatro par metros especificados acima preenche o c digo de seguran a apenas os d gitos clica no bot o Search e no primeiro composto da lista de resultados clica em View para visualizar a ficha do composto 13 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 3 Insira um composto de CASRN 10025 87 3 e quatro campos escolha Procedimento Esperado O utilizador clica em Insert Data o sistema de Login ainda n o estava dispon vel data de realiza o dos testes de usabilidade no menu lateral preenche selecciona no formul rio o CASRN e quatro par metros e clica no bot o Add Data Nestes testes foram registadas medidas de performance com base na velocidade de execu o de cada uma das tarefas tempo dispendido a realizar a tarefa e no n mero de erros cometidos relativamente ao procedimento esperado Figura 56 Figura 56 Avalia o dos prot tipos de alta fidelidade O utilizador desempenha as tarefas apresentadas enquanto o analista monitoriza o tempo dispendido e o n mero de erros cometidos durante a reali
19. de Pesquisa Simples na qual pode ser especificado um termo de pesquisa e o tipo de pesquisa a efectuar Search Name ae Please do not use wildcards Help The page at http xldb di fc ul pt says Figura 25 Mensagem de aviso de que o utilizador n o inseriu o termo da pesquisa Na pesquisa por nome o utilizador dever inserir o nome do composto de acordo com as regras IUPAC N o ser necess rio utilizar wildcards j que a compara o se baseia na procura do termo inserido nos nomes contidos na base de dados utilizando a fun o LIKE termo representa zero ou mais caracteres Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas do MySQL Em termos de interface quando o tipo de pesquisa Name seleccionado apresentada uma instru o de pesquisa que indica ao utilizador que n o deve utilizar wildcards assim como uma liga o sec o de ajuda deste tipo de pesquisa Figura 26 ere SEE Please do not use wildcards Help Figura 26 Formul rio da Pesquisa Simples por nome particularidade da Figura 24 Na pesquisa por f rmula molecular o utilizador dever inserir a f rmula que pretende encontrar com os elementos qu micos na ordem CHXNOS Poder utilizar o wildcard 2 para substituir o n mero de tomos de um determinado elemento por exemplo a pesquisa por
20. dispon veis publicamente A interface desenvolvida possibilita o uso das seguintes funcionalidades por parte dos o utilizadores pesquisa simples pesquisa estrutural e inser o de dados mediante registo e autentica o no sistema o administradores remo o actualiza o de dados valida o de dados inseridos pelos utilizadores e controlo do uso do sistema De acordo com a avalia o realizada a interface mostrou se flex vel f cil de usar reduzida necessidade de carga cognitiva por parte do utilizador e com tempos necess rios para realizar as tarefas curtos O desenvolvimento deste Sistema de Informa o n o foi uma tarefa trivial e representou um desafio para todos os intervenientes tanto para a equipa do 86 Cap tulo 5 Conclus es ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas desenvolvimento inform tico como para a equipa de investigadores da rea da Termoqu mica que compilaram e avaliaram criticamente os dados e que tamb m participaram na modela o e avalia o do sistema ThermInfo concep o deste sistema n o se centrou apenas na implementa o mas sim num conjunto de tarefas integrativas nomeadamente na modela o na an lise de requisitos a v rios n veis nos utilizadores que o v o utilizar no tipo de funcionalidades que se pretendeu disponibilizar e nos resultados de avalia o do sistema A metodologia adoptada permitiu a implementa
21. dos dados relativos s caracter sticas dos compostos nas folhas de c lculo Cada uma das 28 caracter sticas encontra se numa coluna e a sua presen a em cada um dos compostos assinalada com um X e Vista sobre o conjunto dos dados muito limitada as folhas de c lculo n o permitem seleccionar apenas determinadas zonas do conjunto de dados ou fazer ordena es aos mesmos o que torna a sua consulta muito complicada Para visualizar dados mais abaixo na folha n o conseguimos ver o cabe alho das colunas e quando existem m ltiplas folhas de c lculo temos de memorizar o termo que faz a correspond ncia entre ambas Outro problema prende se com o armazenamento das imagens dos compostos por exemplo no formato JPEG que n o se encontram directamente nas folhas de c lculo e mais uma vez tem de haver um c digo de liga o entre os dados dos composto e a sua imagem estrutural Figura 3 Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas A c a gt 4 1 Reference Code Author s Journal Book Title Year Vol Issue Pag s 2 1994PED J B Pedley Thermochemical Data and Structures of Organic Compounds 1994 1 571 E 4 A i D E F G H 1 J K ai Te 1 MoLID CASRN Samos andard Molar Eathalpy of Formati Error andard Molar Esthalpy of Formati Error andard Molar Eathalpy of Formati Error andard Eathalpy of Phase Chan Error Refece
22. factores tamb m apresentada uma listagem dos cem ltimos endere os Internet Protocol IP dos utilizadores que realizaram pesquisas no sistema Figura 47 b Search Statistics a Year iMonth Jan Feb Mar Apr May Jun Jul Aug Sept Oct Nov Dec Total 2009 0 0 E 0 E 0 65 0 0 0 0 0 ao Total Bo 0 T 0 0 Last 100 visitor IP s b IP 1 LOO Sse Vou Pd oo mn Oo oo i cn T O oo En ta Da Do Pa in On D 4 are SL este 5 10 10 5 59 b 10 10 5 59 T 10 10 5 59 6 10 101 158 100 g 10 101 15 100 a a ann aT om Figura 47 Interface que permite a monitoriza o do uso das funcionalidades de pesquisa a Estat sticas do n mero de pesquisas realizadas e sua localiza o temporal b Listagem de endere os IP dos cem ltimos utilizadores que realizaram pesquisas 57 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e Ajuda Para al m das informa es de utiliza o que v o aparecendo nas diversas funcionalidades e que j foram explicitadas anteriormente o sistema Therminfo cont m um manual de instru es Help Este manual cont m informa o sobre o que s o e como se utiliza correctamente cada uma das funcionalidades dispon veis para os utilizadores Para al m da descri o textual existem tutoriais em v deo e imagens alusivas a essa componente escrita Figur
23. fc ul pt wiki Ana_teixeira Jos Artur Martinho Sim es E mail jams fc ul pt Webpage http ww dab fc ul ptidocentes jams Jo o Paulo Leal E mail jplealDitn pt Webpage http ww dab fc ul ptidocentes ipleal Rui Centeno Santos E mail rjsantos fc ul pt Webpage at 4 f Publications Additive methods for prediction of thermochemical properties The Laidler method revisited 1 Hydrocarbons J P Leal Phys Chem Ref Data 2006 35 55 76 doi 10 1063 1 1996609 Figura 19 P gina de apresenta o da equipa do sistema ThermInfo e C digo de Seguran a Todas as funcionalidades p blicas disponibilizadas pelo Therminfo utilizam um Completely Automated Public Turing Test to Tell Computers and Humans Apart CAPTCHA para diferenciar humanos e m quinas O 5 CAPTCHA http captcha net 36 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas principal objectivo deste c digo de seguran a no sistema ThermInfo evitar spam e impedir que software malicioso automatizado aceda inadvertidamente base de dados Este CAPTCHA Figura 20 requer que o utilizador identifique apenas os n meros num c digo aleat rio de seis caracteres composto por letras n meros e ou caracteres especiais Se o utilizador n o inserir ou inserir um c digo de seguran a errado ser retornada uma mensag
24. o mesmo design para todas as funcionalidades e formul rios e Preven o de erros utilizando informa es de preenchimento nos formul rios e documenta o de ajuda Figura 55 Mi lecculer Formula Y search Please type Molecular Formula with atoms in CHXNOS x halogen order Wildcard represents one character Help Figura 55 Preven o de erros durante a pesquisa de um composto utilizando informa es do formato do termo de pesquisa e Est tica e design minimalista de forma a centrar a aten o do utilizador na tarefa que est a desempenhar e n o na Interface c Percurso Cognitivo an lise do caminho percorrido para realizar cada tarefa quer em termos de n mero de passos GOMS Goals Operators Cap tulo 4 Avalia o 68 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Methods Selection quer em termos de tempo de execu o de cada um dos passos KLM Keystroke Level Model Tabela 2 25 Tabela 2 Tempo de execu o para cada um dos comandos utilizados durante a realiza o de tarefas segundo o modelo KLM Abreviatura do Tempo t Comando Comando segundos Keying tempo que o utilizador demora a K 0 28 carregar numa tecla Tempo que o utilizador demora a pressionar o 02 bot o do rato Pointing tempo que o utilizador demora a 11 apontar uma posi o no ecr Homing tempo que o utilizador demora a mover 04
25. o realiza as modifica es necess rias aos dados na base de dados principal c A apresenta o de informa o pode ser obtida com base em 2 tipos de pesquisa base de dados simples e estrutural utilizando as tecnologias HTML CSS JS PHP e MySQL Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas 3 5 Interface Como ja foi descrito anteriormente a interface do sistema Therminfo tem como principais objectivos disponibilizar as funcionalidades do sistema via Web de forma simples e adequada s tarefas e utilizadores em quest o ou seja cumprir os requisitos delineados 3 5 1 Prot tipos de baixa fidelidade A primeira abordagem ao design da interface foi a realiza o de prototipos de baixa fidelidade para serem testados com utilizadores Esta abordagem tem como objectivos explorar o universo de possibilidades de uma forma r pida e a baixo custo colmatar a an lise de requisitos realizada com utilizadores e conceber um fio condutor ao design do prot tipo de alta fidelidade 22 25 27 28 e P gina de Entrada J Figura 11 Prot tipo de baixa fidelidade para a p gina de entrada no sistema 29 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas A p gina de entrada Figura 11 apresenta um menu lateral com as diversas funcionalidades dis
26. se registaram Assim apresentado um quadro que cont m o nome do utilizador o seu e mail e a Institui o a que pertence Figura 45 a Se o administrador aceitar o utilizador este adicionado base de dados e recebe um e mail com os dados necess rios para o login o e mail e uma palavra chave gerada aleatoriamente e assim posteriormente ter acesso funcionalidade de Inser o de dados Todos os utilizadores que t m acesso inser o de dados s o apresentados ao administrador num quadro id ntico ao descrito anteriormente Figura 45 b O administrador poder em qualquer momento remover o acesso a qualquer um destes utilizadores registados Cap tulo 3 Metodologia e Implementa o 56 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Wednesday July 22 2009 E SF About Us Search Structural Search Login ID Name E mail Institution Add Delete ad dido 6 Miquel Teixeira jmiguel gmail com IST F F Administration 5 Ana Teixeira anaisabel_teixeira hotmail com FCUL F oO Help ee Contact Us Add Delete Users Add new users to the Database a 2 Database Users b ID Name E mail Institution Delete 1 4na Teixeira analinoteixeira gmail com FCUL F 2 Rui Santos rjcs Fc ul pt FCUL Fi 4na ateixeira lasige di Fc ul pt FCUL oO Add Delete Users Figura 45 Funcionalidade Painel de Controlo para a monitoriza o dos utilizadores que pode
27. termo s da pesquisa 3 envia tipo a da pesquisa 1 Pesquisa um composto 4 Ver fica a validade do s termo s da pesquisa WORSE Formulario Pesquisa Verifica dados da pesquisa 5 Exibe listagem de resultados 6 Envia pedido da ficha do composto 7 Exibe a ficha do composto pee ie RR oe Ficha do composto Listagem de resultados Figura 23 Diagrama de Colabora o do Caso de Uso Pesquisar um Composto Representa os eventos que o actor utilizador realiza para visualizar a ficha do composto descrevendo as entradas e saidas de dados e as mensagens do sistema para cada evento Para este efeito podem ser realizados dois tipos de pesquisa 1 Pesquisa simples baseada apenas num par metro que poder ser Nome do composto f rmula molecular ID molecular CASRN ou SMILES Figura 24 Se o termo da pesquisa n o for inserido o utilizador alertado com uma mensagem que o avisa do sucedido Figura 25 Capitulo 3 Metodologia e Implementa o 39 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Tuesday July 7 2009 Home About Us Search Structural Search Insert Data Help Contact Us Home About Us Sea rc h T C Structural Search Please do no Molecular Formula Molecular ID Login Insert Data Security code Administration Type only numerical characters Ignore letters and special characters Help Contact Us Figura 24 Pagina
28. 100 0 Tarefa 100 0 Hi E 2 O3 80 0 80 0 60 0 60 0 40 0 40 0 Percentagem de utilizadores 20 0 20 0 0 0 0 0 0 1 2 1 N mero de Erros N mero de Erros Figura 58 Distribui o da percentagem de utilizadores pelo n mero de erros cometidos em cada uma das tarefas I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 pesquisa simples Tarefa 2 pesquisa estrutural Tarefa 3 inser o de dados A an lise da Tabela 4 permite verificar que a m dia do n mero de erros cometidos muito baixa uma m dia inferior a 0 6 erros A Figura 58 permite visualizar a distribui o da percentagem de utilizadores a cometer um determinado n mero de erros Em ambos os grupos a maior parte dos utilizadores n o cometeram erros durante a utiliza o As diferentes tarefas n o apresentam grandes diferen as em termos do n mero de erros cometidos tal como as diferen as entre os grupos n o parecem significativas No entanto esta an lise de resultados deveria ser confirmada recorrendo ao teste estat stico Qui quadrado para verificar se o n mero de erros cometidos durante a realiza o das tarefas depende da forma o profissional do utilizador Os principais N mero de erros cometidos pelos utilizadores Tarefa Hi m2 03 81 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Pr
29. 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas iv facilidade de memoriza o do modo como as tarefas s o realizadas v satisfa o do utilizador Foram realizados dois tipos principais de avalia o durante o desenvolvimento do sistema ThermInfo especialmente para as funcionalidades que v o estar dispon veis aos utilizadores em geral a pesquisa e a inser o de compostos 1 Inspec o de Usabilidade sem utilizadores A inspec o de usabilidade foi realizada por alguns membros da equipa do sistema ThermInfo e baseou se em a Avalia o dos prot tipos de baixa fidelidade esta avalia o ocorreu numa fase inicial do desenvolvimento da interface e teve como principal objectivo verificar se as funcionalidades requeridas foram correctamente compreendidas isto serviu como complemento s entrevistas realizadas para elaborar a an lise de requisitos Figura 52 Esta avalia o serviu tamb m para testar possibilidades de design e layout a serem utilizadas em fases posteriores do projecto N Figura 52 Avalia o dos prot tipos de baixa fidelidade Um dos analistas apresenta os prot tipos de papel de acordo com as escolhas do utilizador durante a realiza o das tarefas simulando o fluxo de interac o 65 Cap tulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas b An lis
30. Administrador Figura 41 Diagrama de Colabora o do Caso de Uso Inserir um novo composto org nico Representa os eventos que o actor utilizador realiza para inserir um novo composto na base de dados descrevendo as entradas e sa das de dados e as mensagens do sistema para cada evento e Validar dados inseridos por utilizadores Apesar dos dados serem automaticamente validados aquando da inser o pelos utilizadores em termos de formato tipo de dados d gito controlo entre outros um dos principais objectivos do sistema Therminfo conter Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas dados de qualidade Para isso todos os dados inseridos t m de ser validados por um administrador experiente em termoqu mica Esta valida o consiste numa avalia o cr tica da consist ncia dos dados atrav s de an lise bibliografica por compara o com valores experimentais de compostos da mesma fam lia por aplica o de m todos emp ricos de aditividade de propriedades 29 30 e ou por utiliza o de m todos de qu mica computacional 31 Uma vez que na inser o dos dados pelos utilizadores os nicos campos obrigat rios s o o nome e uma refer ncia bibliogr fica o administrador para poder validar os dados tem de garantir a Inser o de pelo menos todas as propriedades estruturais do composto Esta funcionalidade ainda n o se encontr
31. C H11 ira retornar todos os compostos que t m 2 9 Mais uma vez o modo de pesquisa n o estrito retornando as f rmulas existentes na base de dados que cont m o termo da pesquisa Em termos de interface quando o tipo de pesquisa Molecular Formula seleccionado s o apresentadas duas instru es de pesquisa que indicam ao utilizador a ordem em que os elementos se devem encontrar e a possibilidade de utilizar o wildcard assim como uma liga o sec o de ajuda deste tipo de pesquisa Figura 27 Molecular Formula Y search Please type Molecular Formula with atoms in CHXNOS x halogen order Wildcard represents one character Help Figura 27 Formul rio da Pesquisa Simples por f rmula molecular particularidade da Figura 24 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Na pesquisa por ID molecular o utilizador dever inserir ID do composto de acordo com o seu formato CONNNNN N digito Quando a pesquisa submetida antes da procura do termo inserido na base de dados feita uma verifica o a este formato Caso o formato n o seja o correcto ser retornada uma mensagem que informa o utilizador Figura 28 Em termos de interface quando o tipo de pesquisa Molecular ID seleccionado apresentada uma Instru o de pesquisa que indica o formato do ID assim como uma liga
32. N 120 PP 100 100 A ON J oOo O amp O MN p gt oO nN 100 gt ON O nl O ta NO Nn J AJU Nn Oo gt Nn gt Nn J Oo Oo OAJ aJa 95 Q15 Q16 Q17 Q18 Anexos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas ON NO Mt ont Ol NINO Bla O SR nl O O 96
33. SCID Um ponto importante que existem diferen as entre mai sculas e min sculas Por exemplo o cyclohexane tem o SMILES CICCCCCT enquanto o benzene tem o SMILES clcccccl 14 e USMILES Unique Simplified Molecular Input Line Entry System um tipo especial e nico de SMILES entre todas as possibilidades v lidas para uma dada estrutura molecular 15 e Classe divide os compostos nas grandes classes estruturais por exemplo cadeia aberta c clicos arom ticos poli arom ticos etc 9 12 e Subclasse divide os compostos pelo tipo de tomos presentes por exemplo CH CHO CHN etc ou pelo tamanho dos ciclos presentes nos compostos c clicos an is de 3 4 5 etc tomos 9 12 e Fam lia separa os compostos em fam lias qu micas de acordo com os arranjos de tomos grupos funcionais mais relevantes existentes na mol cula 9 12 e Caracter sticas s o tags atribu das aos compostos e est o relacionadas com a presen a de um determinado grupo funcional o qual respons vel pelas propriedades qu micas ou por determinadas caracter sticas f sicas do composto 9 12 Dados Termoqu micos A termoqu mica estuda a energia associada a uma reac o qu mica A reac o classificada como exot rmica se se realiza com liberta o de energia ou endot rmica se se realiza com absor o de energia 16 17 14 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o p
34. Se C9HIGO2 Molecular Weight 156 22 Toma Physical State Liquid SMILES C CCCC oCC CIC 0 Unique SMILES C CH2 CH2 CH CH2 O O CH2 CH CH3 CH3 Class Acyclic Compounds ij Sub Class Oxygen Compounds Nj Family Alkoxyalkenoic Acid Esters v Characteristic C alkane Alkene o Alkyne C arene C alcohol C Ether C Peroxide O Aldehyde C ketone C carboxilic Acid Ester D amine CI Hydrazine CI Imine C nitrile tsonitrile L nox El amide E Thiol D thioether O Polysulphide 0 Thiocarbonyl E sox o Halogen D Radical 0 Charges C tonic O Solvation o Polymer Thermochemical Data Standard Molar Enthalpy of Formation Crystalline Phase kJ mol Error th Standard Molar Enthalpy of Formation Liquid Phase kJ mol 488 2 Error 43 3 Standard Molar Enthalpy of Formation Gas Phase kJ mol 436 Error 3 6 Standard Molar Enthalpy of Phase Change kJ mol 51 5 Error H 4 Observations References Author J B Pedley Journal mical Data and Structures of Organic Compounds Year 1994 volume 1 Page 571 More References F iv Author Journal Year Volume Page Update Data Figura 43 Formul rio de actualiza o dos dados dos compostos existentes na base de dados do sistema ThermInfo Se a funcionalidade pretendida for a remocao do composto apresentada
35. Sith ja peeked Aki E 17 25 co00022 464 06 2 223 bl MMH Dieta DALIT Aqua Eira mpira Aiii E 18 26 CO00023 11 65 93 Octane W GOS GEH BELEA Sopi Comooeeds Bipi baa Akr 27 000024 592 27 8 2 Meth m ii Cloe KABIT ope Comprando Ep rccutoas Aima x 28 C000025 563 811 SMEN w E cha KASTA Aore Compounds Aisir x 19 23 C000026 583 53 7 4 Methy z a E 30 000027 619 93 8 3 Ethylh SE Cg LATE Jka Compan Bira Aina x 20 31 C0000268 590 73 8 22 Dim M COMENT CT HO GEL Appike Copel Pips oe Hom Alien E 21 32 000023 584 94 1 2 3 Dim Cia Cire EORNM Sopir Compri mpos pba Alwar E 33 CO00030 583 43 5 2 4 Dim Db Gist CHE WEST Api Comprando Bedroom Alias E an 34 CO00031 592 13 2 25 Dim 3 OI CHE n Sida E ruas dl I 35 C000032 563 16 6 3 3 Dim poo Cir KRHS a Ale x 36 CO00033 583 48 2 3 4 Dim i rere E 37 CO00034 609 26 7 3 Ethyk 7 com Cr BSH utah 7 ptapoinndaid Sith is foi kainji A 38 CO00035 1067 08 35 3 Ethy d4 COMM CETHA Cd STS Api Ciaiysji dd a Ser E 33 C000036 564 02 3 223 7 i Cie Gin Ba UR Sopi Deanne Bpjs boes Anes E 40 CO00037 540 54 1 224T 3i Cie Cian na SR aop Composed Epdrorutoas Alias z 41 C000038 560 214 2537 zr COOS CEH BUSTERS acpi Comprei Aksar x 42000039 565 75 3 234T 3a CoooogT CHM BL Rope ezk apr cms Annan T 43 CO00040 534 52 1 2233 orci og fr E 44 CO00041 111 84 2 Nonane 2 CH CNA STU Astra Copan ed a bii 45 00042 1071 26 7 Dim CO iA al acpi eed Bette Akyar 46 CO00043 1067 20 5 3 3 Diel H
36. UNIVERSIDADE DE LISBOA Faculdade de Ci ncias Departamento de Informatica ThermInfo Sistema de Informacao para Coligir e Apresentar Propriedades Termoquimicas Ana Isabel Lino Teixeira Mestrado em Tecnologias de Informa o Aplicadas as Ci ncias Biol gicas e M dicas 2009 UNIVERSIDADE DE LISBOA Faculdade de Ci ncias Departamento de Informatica ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Ana Isabel Lino Teixeira Trabalho orientado pelo Prof Doutor Francisco Jos Moreira Couto e co orientado pelo Prof Doutor Rui Jorge Centeno Santos Mestrado em Tecnologias de Informa o Aplicadas as Ci ncias Biol gicas e M dicas 2009 Resumo A investiga o na rea da Termoquimica origina e requer grandes quantidades de dados relativos a diversas propriedades dos compostos qu micos necess rio organiz los e disponibiliza los de forma estruturada simples coerente permitindo a coopera o entre a comunidade cient fica e a evolu o ao longo do tempo Devidos aos in meros problemas que adv m da utiliza o de folhas de c lculo para este efeito estruturou se a proposta deste trabalho a implementa o de um Sistema de Informa o para coligir e apresentar propriedades estruturais e termoqu micas de compostos org nicos Procurando responder simultaneamente s necessidades de armazenamento manipula o e visualiza o dos dados termoqu mico
37. a o de algoritmos t cnicas computacionais e m todos estat sticos aos dados 3 6 A esta rea do conhecimento d se o nome de quimio inform tica tradu o do A 2 ingl s cheminformatics 900000 Legenda 800000 N mero de publica es ano 00000 CI N mero de patentes ano 600000 300000 400000 300000 200000 A v E a v q ou a vw v tO gt gt 2 v Ke 9 L v e E J Z 100000 A MM 0 fit ee LA 1900 1920 1940 A 1960 1980 2000 no UT TTL Figura 1 Representa o da curva de crescimento do n mero de artigos e patentes registados pelo CAS relativos informa o qu mica publicada ao longo do tempo adaptado de 2 Consiste no uso de m todos inform ticos para resolver problemas qu micos 1 4 Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 1 2 Motiva o investiga o na rea da Qu mica requer muitas vezes a pesquisa de dados relativos a diversas propriedades dos compostos qu micos No entanto a pesquisa dos mesmos em livros e artigos cient ficos uma tarefa complexa e morosa Para colmatar estes problemas importante o desenvolvimento de bases de dados p blicas que permitam compilar e realizar pesquisas r pidas e f ceis Nos dias de hoje a maioria das bases de dados termoqu micas existentes s o de acesso privado sendo a sua aquisi o car
38. a n o permitindo o desenvolvimento e aplica o de m todos estat sticos e ou de previs o Por sua vez as bases de dados p blicas cont m uma quantidade de informa o reduzida maioritariamente n o criticamente avaliada e s o muitas vezes termodinamicamente inconsistentes envolvendo grande quantidade de recursos o que as torna complexas e confusas de utilizar 4 6 Para resolver estes problemas o Grupo de Energ tica Molecular do Centro de Qu mica e Bioqu mica da Faculdade de Ci ncias da Universidade de Lisboa que tem como principal objectivo o estudo das rela es entre a estrutura a energ tica a reactividade e a fun o dos compostos qu micos compilou da literatura e avaliou criticamente os dados termoqu micos experimentais de diversos compostos qu micos Estes dados foram guardados em folhas de c lculo mas este modo de armazenamento revela v rios problemas nomeadamente e Integridade dos Dados para alterar ou apagar dados relativos a um ou a v rios compostos em m ltiplas linhas e ou m ltiplas folhas de c lculo necess rio que a mesma ac o seja repetida v rias vezes Com este procedimento se algum campo esquecido os dados relativos ao composto v o tornar se amb guos e perder a integridade Grupo de Energ tica Molecular http cqb fc ul pt menergetics Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e Redund nci
39. a 48 e 49 Todas as funcionalidades que se encontram mencionadas neste manual cont m hiperliga es directas sec o correspondente Search Help Table of Contents Structural Search p Search Insert Data Searching by name Searching by Molecular Formula Searching by Molecular ID Searching by CASRN Contact Us Searching by SMILES Administration Security code Structural Search Insert Data Registering an account Logging in Inserting new Data Search a The search option offers a quick search tool that furthermore lets you specify the search term with a search type Molecular formula Molecular ID CAS RN SMILES A successful search displays the 100 most relevant compounds with a summary of the information listed to each compound and by clicking View to a specific search result you wil be directed to the complete information available The results are ordered by relevance the distance of the specified term to the beginning of the sentence Type of Search LJ cS Please do not use wildcards Help search hints i Example of a valid security Security code fTPZEZA 5274 Type only numerical characters Ignore letters and special characters Figura 48 Conte dos do manual de instru es do sistema ThermInfo a Descri o textual do que a funcionalidade e quais os passos a seguir para realizar uma pesquisa b Imagem alusiva descr
40. a avalia o da sua perigosidade energ tica potencial numa instala o industrial Muitos dos crit rios de avalia o da perigosidade dos compostos qu micos propostos pela American Society for 8 uma fun o termodin mica especialmente til quando se lida com processos a press o constante definida por H E PV onde E a energia P a press o e Vo volume 15 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Testing and Materials ASTM t m por base a utiliza o da entalpia de forma o do composto no estado gasoso 19 20 A entalpia de forma o padr o fundamental para a avalia o do potencial de decomposi o exot rmica de um composto geralmente quanto mais positivo o valor da entalpia maior ser o potencial de decomposi o exot rmica 18 Este par metro termoqu mico pode ser obtido por via experimental metodologias complexas e nem sempre aplic veis ou por m todos estat sticos de previs o por extrapola o de dados j existentes Assim evidente a grande necessidade de se organizar e disponibilizar os valores desta propriedade de modo a permitir por exemplo a aplica o de m todos emp ricos para a sua previs o 21 ASTM http www astm org Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Metodologia e Imp
41. a completamente implementada no entanto o plano mostrar ao administrador a listagem dos nomes dos compostos inseridos pelos utilizadores e que se encontram em espera para valida o Este poder seleccionar um composto sendo lhe apresentado um formul rio id ntico ao da inser o de dados mas os campos submetidos pelo utilizador aquando da inser o s o automaticamente carregados Assim O administrador poder adicionar remover ou actualizar esses dados e posteriormente guard los se o processo de valida o ainda n o estiver completo apag los se considera que os dados n o t m interesse ou n o s o consistentes com a bibliografia apresentada ou ent o inseri los na base de dados Quando o processo de valida o estiver conclu do a decis o do administrador automaticamente reportada por e mail ao utilizador que depositou os dados e Actualizar apagar dados dos compostos As funcionalidades para remover e actualizar os dados dos compostos org nicos existentes na base de dados est o dispon veis apenas para administradores Para encontrar o composto a actualizar ou remover o administrador ter de o pesquisar utilizando o ID molecular numa caixa de pesquisa Figura 42 Como este se trata de um identificador nico esta 51 Capitulo 3 Metodologia e Implementa o 52 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas pesquisa s retorna um composto ou nenhum
42. a dos Dados este tipo de armazenamento muitas vezes ineficiente exigindo a repeti o dos mesmos dados v rias vezes Assim O conjunto de dados cresce desnecessariamente s o necess rios mais recursos computacionais o acesso torna se mais dif cil e lento e a integridade dos dados mais complicada de manter Um bom exemplo deste problema a exist ncia de 28 diferentes caracter sticas atribu das aos compostos org nicos de acordo com os grupos funcionais presentes na estrutura entre outras caracter sticas f sicas Tendo em conta que cada composto pode ter mais que uma caracter stica ter amos tr s op es de armazenamento a m ltiplas caracter sticas na mesma c lula b cada caracter stica numa coluna c cada coluna uma caracter stica e em cada c lula marcada a sua presen a ou aus ncia Neste caso foi adoptado o ltimo processo de armazenamento o que obriga exist ncia de 28 colunas para guardar informa o sobre as caracter sticas de um composto Figura 2 e Validade e n o uniformidade dos dados a inser o de dados pelo Homem fal vel e vari vel pelo que sem restri es e meios de verifica o as folhas de c lculo n o nos permitem detectar os erros diferen as nos formatos e dados iguais escritos de diferentes formas Isto causa problemas quando queremos por exemplo fazer estat sticas sobre os compostos qu micos como seja o n mero de compostos pertencentes a uma deter
43. a ficha que especifica toda a informa o contida na base de dados relativo ao mesmo Figura 44 Ap s visualizar os dados do composto o administrador poder optar por remov lo carregando em Delete Ser lhe solicitada a confirma o de que realmente quer realizar esta opera o 53 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Figura 44 a e em caso afirmativo o sucesso da mesma explicitado com uma mensagem adequada Wednesday July 22 2009 Home About Us Search Structural Search Insert Data Help Contact Us About Us Search for a molecule to delete Search Structural Search Molecular ID Molecular ID format CONNNNN NNNNN 5 digits Insert Data Administration Contact Us Z 3 Pentenoic acid ethyl ester e dn Molecular ID co00488 Compound 2 3 Pentenoic acid ethyl ester CASRN 27829 70 5 Molecular Formula CzH120 gt Molecular Weight 128 17 Physical State Liquid SMILES CC CICC OCC 0 Unique SMILES C CH2 CH CH CH3 O O CH2 CH3 Standard Molar Enthalpy of Formation Crystalline Phase kJ mol n a Error na Standard Molar Enthalpy of Formation Liquid Phase kJ mol 432 4 Error 3 3 Standard Molar Enthalpy of Formation Gas Phase kJ mol 387 6 Error 3 5 Standard Molar Enthalpy of Phase Change kJ mol 44 8 Error 1 2 Obs
44. a m o do rato para o teclado ou vice versa Mentally Preparing tempo que o utilizador leva M 135 a preparar mentalmente a pr xima ac o Responding tempo que o utilizador deve esperar pela resposta do sistema vari vel Seguidamente foram calculados os tempos de execu o esperados para a realiza o de tr s tarefas relacionadas com as funcionalidades dispon veis para os utilizadores Mais adiante estes tempos ser o utilizados como refer ncia uma vez que os testes de usabilidade com utilizadores se basearam na realiza o das mesmas tarefas Objectivo Pesquisar o composto com SMILES CCCCCO Ac es 1 Mover a m o para o rato H 2 Prepara o Mental M 3 Mover o cursor do rato at Search P 4 Carregar no bot o do rato B 5 Prepara o Mental M 6 Mover o cursor at caixa do termo da pesquisa P 7 Mover a m o para o teclado H 8 Prepara o Mental M Capitulo 4 Avaliacdo 69 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 9 Digitar o termo da pesquisa CCCCCO 6K 10 Mover a m o para o rato H 11 Prepara o Mental M 12 Mover o cursor at caixa da escolha do tipo de pesquisa P 13 Clicar no tipo de pesquisa pretendido SMILES B 14 Prepara o Mental M 15 Mover o cursor at caixa do c digo de seguran a P 16 Clicar na caixa do c digo de seguran a B 17
45. ace Co 5 E H Crystalline Phase Liquid Phase Gas Phase 3 kJimol kJimol kJimol kJimol kJtmol kJtmol kJimol Jimol 6 4 CO00001 74 82 8 Methane 144 04 1994PED 5 CO00002 74 84 0 Ethane 93 6 25 838 03 38 1994PED ty 6 CO00003 74 38 6 Propane 1203 25 1047 05 16 2 1994PED 7 CO00004 106 37 58 Butane 1413 25 1257 06 216 1994PED 8 8 C000005 75 28 5 2 Methyloropane _ a meals a p 1542 12 134 2 06 20 0 1934PED e g fica oso tela A LS c 7 E Set Co Es TE 10 1 C000005 463 82 1 22 Dim Wal i Weleqalar Permalbtaleqalar weigh Cikti Dab qhaga Tiny Alias Alene Albper Airas Aria ei ia alli Macs Ape arit Dimas Hode ean De 12 C0000093 110 54 3 Hexane oF COM Hi TILIL api Capen pth went adr 11 13 COOOO10 107 83 5 2Meth CARDO Gm SOON iode Compoande Bpdrocuboad Almas E 14 C0000 96 14 0 SME cria Gira BAD GAA Acpdic Compounds Bpdrecutbots Allies x 12 I ee ME cam AEE Appike Composdy Spdre uboss Aes x 13 1 COOODIS 142 62 5 Heptang SORA DETK PREIE Aoi Diani Bira Ann E 18 CO00015 531 76 4 2 Meth 7 COS CHRI TEMA Api Ciipeanji Mi ho pmi Shii E 14 13 CO00016 5839 34 84 S Meth CRT Ci REMA Appie Capes Bpap Aker 20 CO00017 617 78 7 S Ethylp Sie Gt Tia Sopi Comprando pedro ba dr x 15 21 CO00016 5590 352 2200 iq oo Cima BAITS Mopidi Compounds Epdrocurboas Abas x 22 C0000193 565 59 35 25 Dim y cromo amu TOLLER e ii di pr 16 23 C000020 108 08 7 2 4 Dim TEA Apel Cad viana a 24 CO00021 562 43 2 3 3 Dim E Ghat Oh Pe Th Apps tle 1 apl
46. achieving your goals Zig Ziglar Desde cedo que a necessidade de compreender os fen menos da Natureza e o gosto pelo estudo das Ci ncias F sico Qu micas e Naturais despertou em mim o desejo de vir a enveredar por uma carreira de investiga o nesta rea Raz o pela qual ingressei no Curso de Biologia da Faculdade de Ci ncias da Universidade de Lisboa Posteriormente optei pelo ramo de especializa o em Biologia Funcional e de Sistemas no qual foram leccionadas cadeiras que servem de base para uma abordagem integrativa na resolu o de problemas a v rios n veis de organiza o isto focando a aten o em todos os componentes do sistema e na forma como estes interagem enquanto parte do mesmo A cadeira de Fundamentos de Bioinform tica leccionada pelo Professor Doutor Francisco Couto e os vastos conhecimentos do Professor Doutor Jos Alberto Feij na rea da Biologia de Sistemas os quais proporcionaram diversas discuss es contribu ram inegavelmente para perceber o qu o importante e desafiante a aplica o da inform tica ao estudo destes sistemas complexos e ao desenvolvimento de modelos de uma forma integrativa 36 O interesse em alargar os meus conhecimentos nesta rea conduziu minha inscri o no Mestrado em Tecnologias de Informa o Aplicadas as Ci ncias Biol gicas e M dicas 3 Cap tulo 5 Conclus es ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas D
47. al as queries executadas sobre a base de dados obtiveram um tempo de resposta pequeno O tempo de execu o priorit rio para a pesquisa de dados uma vez que o utilizador espera uma resposta Imediata tendo se o sistema revelado eficiente 0 01 segundos Dado o bom desempenho na execu o de queries para este conjunto de dados n o foram realizados estudos de escalabilidade no mbito deste projecto Uma vez que para isso seria necess rio o acr scimo de dados fict cios de forma a averiguar o tipo de fun o matem tica que modela o tempo de execu o No entanto este ser um estudo a realizar quando o conjunto de dados ganhar maior propor o 4 2 Usabilidade da Interface Uma vez que um dos principais objectivos do desenvolvimento do Therminfo a apresenta o de informa o e a coopera o da comunidade cient fica com a inser o de novos dados tornou se evidente a necessidade da realiza o de avalia es usabilidade da sua interface Web Os principais objectivos da avalia o foram 25 27 28 a a obten o de uma Interface com funcionalidades adequadas ao problema e um design adequado realiza o das mesmas pelos utilizadores de modo f cil e eficiente b detectar problemas de usabilidade do sistema em fases precoces do seu desenvolvimento em termos de 1 facilidade de aprendizagem li rapidez no desenvolvimento de tarefas ill n mero de erros cometidos na interac o Capitulo
48. al podem ser especificados os termos de pesquisa Como este tipo de pesquisa tamb m est dispon vel publicamente pelas raz es enunciadas anteriormente o utilizador ter de digitar o c digo de seguran a A listagem de resultados obtida id ntica da pesquisa simples exceptuando a ordem pela qual os compostos s o dispostos Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas e Inser o de compostos A funcionalidade que permite aumentar o conjunto de dados disponibilizado pelo sistema ThermInfo est limitado a utilizadores registados de forma a evitar inser es inadequadas de dados Para suportar o aumento da comunidade que deposita dados existe uma funcionalidade de registo no sistema Esta apresenta um formul rio que requer o preenchimento dos seguintes dados nome e mail e a institui o a que o utilizador est afiliado Figura 37 O formato do e mail verificado ap s a submiss o se este for v lido o utilizador informado de que o seu registo foi efectuado com sucesso No entanto este tem de esperar pela valida o da conta por um administrador que informado da exist ncia de um novo pedido de registo por e mail Ap s a valida o da conta o utilizador recebe um e mail com os dados para entrar no sistema e mail e uma palavra chave gerada aleatoriamente Figura 38 SaturdayJuly 25 2009 Register an acco
49. aliar o primeiro pressuposto foi realizado o teste de Kolmogorov Smirnov KS 25 Este permite testar as seguintes hip teses Ho a popula o tem uma distribui o Normal versus H a popula o n o tem uma distribui o Normal O p value de cada um dos testes encontra se especificado na Tabela 5 Tabela 5 Valores de p value obtido para cada um dos testes de KS realizados I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 pesquisa simples Tarefa 2 pesquisa estrutural Tarefa 3 inser o de dados Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas A um n vel de signific ncia de 5 n o rejeitamos a hip tese nula para nenhum dos testes realizados excep o do teste para o Grupo Q Tarefa 3 p value 0 027 lt n vel de signific ncia Isto todas as amostras provem de popula es com distribui o Normal excep o do Grupo Q Tarefa 3 No entanto vamos assumir que uma amostra de 18 indiv duos suficientemente elevada para que possamos aproximar esta amostra como proveniente de uma popula o com distribui o Normal No que diz respeito ao pressuposto de igualdade de vari ncias foi realizado o teste de Levene no qual as hip teses s o Ho existe homogeneidade entre as vari ncias o Or versus H n o existe homogeneidade entre a
50. almente dispon vel no Website http www therminfo com Um esquema resumo da arquitectura do sistema ThermInfo apresentado na Figura 10 14 Apache http www apache org 2 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas ooo PHP HTML JS amp C55 Navegador Heb E OO ee ee VIA WEB APRESENTA O DE DADOS Figura 10 Modelo simplificado do funcionamento do sistema ThermInfo Neste esquema est o representadas as fontes de dados as funcionalidades administrativas a pesquisa e apresenta o de dados e a forma como estas se relacionam com a base de dados a Fontes de dados 1 as folhas de c lculo nas quais os dados s o automaticamente inseridos na base de dados utilizando scripts Perl e MySQL 2 a inser o de dados por utilizadores via navegador Web utilizando JS HTML PHP e MySQL estes ficam em espera pelo processo de valida o por um administrador numa base de dados tempor rios b Funcionalidades administrativas todas interagem com bases de dados e por isso utilizam as tecnologias PHP e MySQL 1 a valida o de dados permite passar os dados inseridos pelos utilizadores armazenados na base de dados tempor ria para a base de dados que disponibiliza os dados publicamente 2 a remo o actualiza o dos dados transfere os dados originais para uma base de dados desactualizados e no caso da actualiza
51. ao departamento de informatica e ao LaSIGE pela oportunidade de integrar no grupo XLDB e pelas condi es de trabalho oferecidas assim como a Funda o para a Ci ncia e Tecnologia pelo suporte financeiro a todos os membros do LaSIGE pela ajuda e companheirismo e esp rito de grupo ao Grupo de Energ tica Molecular do Centro de Qu mica e Bioqu mica pela participa o activa neste trabalho simpatia pronta disponibilidade para esclarecimentos assim como pelo suporte financeiro a todos os colegas do Mestrado em Tecnologias de Informa o Aplicadas s Ci ncias Biol gicas e M dicas pelas discuss es e longas conversas que em muito contribuir o para a realiza o da parte curricular do mestrado e deste trabalho a Faculdade de Ci ncias da Universidade de Lisboa que a minha segunda casa desde que terminei o ensino secund rio e a todos os professores que contribu ram para a minha forma o acad mica aos meus pais Jos Alberto e Maria Jos pelo amor carinho compreens o e car cter com que sempre me educaram e pelo esfor o dedicado para que eu pudesse chegar aqui ao meu irm o Jos Miguel pelo apoio incentivo companheirismo humor encorajamento e disponibilidade para ajudar ao Emir Catak que esteve sempre pacientemente presente apoiando me e colaborando tanto nas revis es do meu trabalho como quando as minhas for as acabavam aos meus amigos por me acompanharem incentivarem diver
52. ara Coligir e Apresentar Propriedades Termoquimicas e Entalpia de Forma o Molar Padr o a varia o de entalpia para a reac o em que um composto qu mico formado a partir dos seus elementos constituintes cada um no seu estado de refer ncia padr o 16 17 No sistema ThermInfo s o apresentados valores de entalpia de forma o molar padr o e respectivos erros para os estados f sicos cristalino l quido e gasoso e Entalpia de Transi o de Estado Molar Padr o a varia o de entalpia associada aos processos f sicos de transi o de estado f sico 16 17 o Fus o transi o do estado s lido para o estado l quido o Vaporiza o transi o do estado l quido para o estado gasoso o Sublima o transi o do estado s lido para o estado gasoso 3 Dados Bibliogr ficos refer ncias completas relativamente origem dos dados termoquimicos dos compostos incluindo autor es revista cientifica titulo do livro ano volume e p gina s 2 2 Import ncia do Conhecimento da Energ tica dos Compostos Qu micos O conhecimento da energ tica dos compostos qu micos contribui para a compreens o da natureza das liga es qu micas e consequentemente para o estudo das rela es de interdepend ncia correla o entre energ tica estrutura e reactividade 18 O conhecimento da entalpia de forma o de um composto qu mico no estado gasoso um par metro termodin mico muito importante para
53. arefa KLM GOMS m dia segundos segundos au 5 2408 s66 an s8 3531 s80 an cas 2685 64 I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 pesquisa simples Tarefa 2 pesquisa estrutural Tarefa 3 inser o de dados A an lise da Tabela 7 permite nos verificar que as m dias dos tempos obtidos s o superiores aos tempos que seriam esperados segundo o modelo KLM GOMS no entanto seguem a mesma tend ncia Este modelo serviu em fases iniciais para fazer previs es sobre o comportamento dos utilizadores No entanto este modelo concebido para utilizadores experientes conhecedores da interface e numa interac o sem cometer 80 Percentagem de utilizadores Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas qualquer tipo de erros O que n o foi o caso dos tempos obtidos na avalia o de usabilidade com os utilizadores Estes utilizaram a interface pela primeira vez onde foram cometidos alguns erros Obviamente o tempo de prepara o mental e de recupera o de erros muito superior numa primeira utiliza o da interface relativamente aos tempos utilizados no c lculo do tempo esperado segundo o modelo KLM GOMS No entanto ambos os tempos permitem considerar a interface eficiente 25 N mero de erros cometidos pelos utilizadores Grupo l Grupo Q
54. can Society for Testing and Materials Completely Automated Public Turing test to tell Computers and Humans Apart Chemical Abstracts Service Chemical Abstracts Service Registry Number Cascading Style Sheets Dynamic Hypertext Markup Language Goals Operators Methods Selection Hypertext Markup Language Identity Descriptor Internet Protocol International Union of Pure and Applied Chemistry Joint Photographic Experts Group Java Script Keystroke Level Model Kolmogorov Smirnov My Structured Query Language Practical Extraction and Report Language Hypertext Preprocessor Structured Language Query Sistema de Gestao de Bases de Dados Unified Modeling Language Unique Simplified Molecular Input Line Entry System 1i 111 Lista de Figuras Figura 1 Representa o da curva de crescimento do numero de artigos ano 2 Figura 2 Armazenamento dos dados das caracter sticas nas folhas de c lculo 5 Figura 3 Folhas de c lculo a consultar para obter a informa o de um composto 6 Figura 4 Metodologia adoptada para o desenvolvimento do sistema Therminjo 9 Figura 5 Funcionalidades disponibilizadas pelo sistema ThermInfo 000006 20 Figura 6 Vis o global das funcionalidades do ThermInfo Use cases 22 Figura 7 Diagrama de classes UML da base de dados do ThermInfo 23 Figura 8 Administra o das tabelas do sistema ThermI
55. char 255 HAS H HAS name varchar 299 email varchar 255 institution varchar 255 password varchar 255 1 Le molecule mol id varchar 255 casrn varchar 255 name varchar 255 formula varchar 255 mw decimal 2 state char 1 smile varchar 255 usmile varchar 255 aH AS 0 1 image longblob 1 HAS i name varchar 255 data crys float 8 1 cerror float 8 1 liq float 8 1 lerror float 8 1 gas float 8 1 gerror float 8 1 phase float 8 1 perror float 8 1 obs varchar 255 ah Ase reference author varchar 255 journal varchar 255 year int volume int page int Figura 7 Diagrama de classes UML da base de dados do ThermInfo As tabelas estao dispostas segundo um c digo de cores que se refere a cada uma das categorias descritas no texto branco para dados estruturais cinzento m dio para dados termoqu micos cinzento escuro para dados bibliogr ficos e cinzento claro para os utilizadores registados no sistema Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Dentro da categoria dos dados estruturais temos 6 entidades relacionadas entre si da seguinte forma a entidade central molecule cont m oito atributos ID molecular CASRN nome f rmula molecular peso molecular estado f sico SMILES e USMILES dos quais quer o ID m
56. char temp gt casm UNIQUE None gt X casm Index 116 736 B Collation latinl swedish ci E user temp O mol image ES mol id UNIQUE None X molid Total 603 736 B Rows 2 956 0 mol images SUNGAY z Create an index on columns Row length 163 O mal imana tamn a ee E a Row size 6 204 B Next Autoindex 2 957 Creation Jun 05 2009 at 04 32 PM Last update Jun 05 2009 at 04 32 PM Figura 8 Administra o das tabelas do sistema ThermInfo utilizando o phpMyAdmin Select fields at least one __pheiviyAdmin alelefole Database therminfo 36 v Number of rows per page 30 Display order v eed O DISTINCT Ascending Descending therminfo 36 admin characteristic characteristic outdated characteristic temp class class outdated class temp EB data E data outdated E data ref E data ref outdated E data ref temp usmile family Add search conditions body of the where clause Or Do a query by example wildcard ie Field Type Collation Operator Value E family outdated mid int 11 E v amp family temp E image mol id varchar 255 latinf swedish ci LIKE v E image outdated image temp casrn varchar 20 latinf swedish ci LIKE v name yarchar 255 latinf swedish ci LIKE v amp molecule temp E mol char for
57. dados foi desenvolvido um script em Practical Extraction and Report Language Perl que se liga a base de dados MySQL abre as folhas de c lculo e vai inserindo cada uma das linhas de dados num array Seguidamente divide cada linha pelo car cter delimitador espa o em branco ou tab e realiza queries SQL para inserir esses dados na entidade atributo correspondente Futuramente os dados ser o inseridos a partir da Interface Web di phpMyAdmin http www phpmyadmin net 2 Perl http www perl org 295 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 26 phpiyAdmin a Server localhost gt Database therminfo ey Structure SAL Search Query Export Eslmport Operations __Database Table Action Records Type Collation Size Overhead therminto 36 O admin E I E x 0 MyISAM latinl swedish ci 1 0 KiB l characteristic i o ii x 28 MyISAM latind_swedish_ci 2 6 KiB therminfo 36 ae sm characteristic outdated Server localhost Database therminfo E Table molecule E admin O characteristic temp S ey E characteristic J Browse Structure mSQL Search Jilnsert BExport Elmport Operations Empty Drop E characteristic_outdated O class haracteristic t 5 E na O class outdated E Field Type Collation Attributes Null Default Extra Action Bee aes O clas
58. du o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 4 Avalia o A usabilidade e poss veis problemas da interface s o testados com e sem utilizadores Para isso s o utilizadas uma s rie de heur sticas estruturados question rios e um conjunto de tarefas a realizar atrav s do qual monitorizado o comportamento dos utilizadores temporalmente e em termos do n mero de erros cometidos i o q dr a oc O An lise do An lise de Modeliza o Implementa o Problema Es m oA tio Ta Problema Requisitos gt do Sistema d Sistema a pe ew eee eo os ETMT oa ERNEA E KHA Manuten o gt Avalia o do Sistema do Sistema DD ce e DDD e DA SEO DDD Dido LM o O MR oe Figura 4 Metodologia adoptada para o desenvolvimento do sistema Therminjo divida em fase distintas que se complementam e interagem entre si 1 5 Organiza o do Documento Este documento est organizado da seguinte forma e Cap tulo 1 enquadra e apresenta o problema em estudo assim como a motiva o e os benef cios de encontrar e desenvolver uma solu o para o mesmo e Cap tulo 2 introduz alguns conceitos de Qu mica necess rios para contextualizar este trabalho nomeadamente no que diz respeito natureza dos dados e Cap tulo 3 descreve funcionalmente a ferramenta desenvolvida e a metodologia utilizadas para a sua Im
59. e e mail assunto da mensagem drop down menu com as seguintes op es Sugest o Coment rio D vida Reportar dados errados desactualizados Reportar dados incompletos Outro e a mensagem propriamente dita Como se trata de uma funcionalidade acess vel publicamente o utilizador ter de inserir o c digo de seguran a Antes da mensagem ser submetida verificado o preenchimento de todos estes campos e a validade do formato do e mail Caso a submiss o da mensagem falhe devido a algum erro nos pontos anteriormente referidos o utilizador visualizar uma mensagem a esse respeito caso contr rio o sucesso do envio Cap tulo 3 Metodologia e Implementa o 60 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas da mensagem confirmado A mensagem submetida com sucesso enviada para o e mail da administra o do sistema ThermInfo Leave us a comment Structural Search Do you have a suggestion comment or wish to send a message to us Did you find any erroneous or incomplete data Then please fill out this contact form Your name and e mail address are required Insert Data Thanks for the feedback Administration Contact Us Name E mail address Subject q Comment Question Erroneous Data Incomplete Data Other Message 164879 Security code Submit Message Erase Message Type only numerical characters Ig
60. e a inser o de novos compostos org nicos no sistema 49 Cap tulo 3 Metodologia e Implementa o 50 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Se os dados forem validados atribu do ao novo composto um ID molecular ficando em espera pelo processo de valida o a executar por um administrador Figura 41 Apenas os administradores podem inserir directamente dados na base de dados sem que passem pelo processo de valida o Para isso existe uma funcionalidade semelhante descrita no menu de administra o em que a nica diferen a inserir directamente o composto na base de dados 2 Envia o e mail do utilizador Envia a palavra chave do utilizado 1 Login no sistema 4 Verifica a validade dos dados do utilizador Utilizador Verifica dados do utilizador registado Formulario Login 1 A valida o dos dados autom ticamente 5 Exibe formul rio para eportada ao utilizador que os depositou por e mail inser o de dados Os dados s o inseridos na base de dados Formul rio Inser o de dados 10 Os dados ficam disponiveis Envia os dados inseridos a todos os utilizadores 9 Administrador verifica e valida os dados 8 dados ficam em espera numa base de dados tempor ria 7 Verifica a validade dos dados Administrador valida Dados em espera para os dados valida o Verifica dados
61. e entre as varias cadeiras de Mestrado que frequentei no primeiro ano do curso algumas merecerem uma aten o especial da minha parte nomeadamente Introdu o as Bases de Dados Aplica es na Web e Sistemas Interactivos A escolha do tema de Disserta o de Mestrado que apresentei neste documento em muito se deveu aos conceitos introduzidos nas cadeiras mencionadas e na vontade de desenvolver um sistema que facilita o dia a dia de investiga o de v rios cientistas Um dos principais objectivos deste projecto era eliminar os problemas que adv m dos processos de armazenamento organiza o visualiza o e partilha de informa o relativa as propriedades estruturais e termoqu micas de compostos org nicos Para isso desenvolvi um Sistema de Informa o ThermInfo baseado numa base de dados para armazenar e organizar os dados com uma interface p blica de f cil utiliza o para inser o e consulta de informa o e uma interface para administra o do sistema Este Sistema de Informa o encontra se dispon vel na Internet atrav s do endere o http www therminfo com e est funcional para os principais navegadores Web Firefox Internet Explorer Opera Safari e Google Chrome A base de dados do sistema Therminfo ainda pequena quando comparada com algumas das base de dados comerciais existentes no entanto cont m cerca de 3000 compostos org nicos nicos criticamente avaliados termodinamicamente consistentes e
62. e identificador n o tem qualquer significado qu mico e atribu do numa ordem sequencial de forma a assegurar a unicidade Tem o formato NNNNNNN NN N 1 a 7 d gitos h fen 2 d gitos h fen 1 d gito O ltimo d gito um d gito de controlo para verificar a validade e unicidade do identificador e calculado da seguinte forma multiplicar o ltimo d gito por 1 o d gito seguinte por 2 e assim sucessivamente todos estes produtos s o somados finalmente computado o m dulo 10 da soma Por exemplo o CASRN do methanol 67 56 1 o TUPAC recommendations http www iupac org web ins 2001 043 1 800 7 CAS Registry Number http www cas org expertise cascontent registry regsys html 12 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas d gito controlo 1 calculado da seguinte forma 6 1 5 2 7 3 6 4 61 61 mod 10 1 F rmula Molecular d indica o dos elementos qu micos presentes e do n mero de tomos de cada um desses elementos representado em ndice 9 12 No sistema ThermInfo os elementos encontram se dispostos na seguinte ordem CHXNOS C carbono H hidrog nio X halog neo fl or cloro bromo 10do N azoto O oxig nio S enxofre Estrutura Qu mica apresenta a geometria molecular mostrando o arranjo espacial dos tomos numa mol cula e as liga es qu micas que os mant m juntos 9 12 A
63. eale R Human Computer Interaction 3rd ed Prentice Hall 2003 26 Williams H E Lane D Web Database Applications with PHP and MySQL 2nd ed O Reilly 2004 27 Shortliffe E H Climino J J Biomedical Informatics Computer Applications in Health Care and Biomedicine 3rd ed Springer 2006 28 Holzingerm A HCI and Usability for Medicine and Health Care Proceedings of the Third Symposium of the Workgroup HCI and Usability Engineering of the Austrian Computer Society USAB 2007 Graz Austria LNCS Springer 2007 29 Leal J P Additive Methods for Prediction of Thermochemical Properties The Laidler Method Revisited 1 Hydrocarbons J Phys Chem Ref Data 2006 35 55 76 30 Santos R C Leal J P Martinho Simoes J A Additivity Methods for Prediction of Thermochemical Properties The Laidler Method Revisited 2 Hydrocarbons Including Substituted Cyclic Compounds J Chem Thermodyn 2009 doi 10 1016 j jct 2009 06 013 31 Montgomery Jr J A Frisch M J Ochterski J W Petersson G A A complete basis set model chemistry VI Use of density functional geometries and frequencies J Chem Phys 1999 770 2822 2827 32 Sebesta R Programming the World Wide Web 4th ed Addison Wesley 2007 33 Nielsen J Discount Usability Counterpoint Something Is Better than Nothing IEEE Software 1997 14 27 28 34 Nielsen J Designing web usability New Riders Publishing Indianapo
64. eeeeeseeseeeeeeseeeeseseeeeeeeeeeeeens 39 Figura 25 Mensagem de aviso de que o utilizador nao inseriu o termo da pesquisa 39 Figura 26 Formul rio da Pesquisa Simples por NOMEC cccccccceeeeeeeeeaeeeeeeeeeseeees 40 Figura 27 Formul rio da Pesquisa Simples por f rmula molecular 40 Figura 28 Mensagem de erro no formato do ID molecular cceeei 41 Figura 29 Formul rio da Pesquisa Simples por ID molecular 41 Figura 30 Formul rio da Pesquisa Simples por CASRN c cc cceeeceeccceeeeeeeeeeeees 42 Figura 31 Mensagem de erro no formato do CASRN ccceeeeeeeeeeeeeeeseeeeseeeeeeeees 432 Figura 32 Mensagem de erro no d gito controlo do CASRN cccceeesesseeeeeeeeees 43 Figura 33 Formul rio da Pesquisa Simples por SMILES eeccccccceeeeeeeeeeees 43 Figura 34 Parte da listagem de resultados obtida para umaa pesquisa 44 Figura 35 Ficha de um composto contendo toda a informa o disponivel 45 Figura 36 Formul rio de Pesquisa Estrutural cccccsseseeeeceeeeeeeeeeeeeeaeaeeeeeesseeees 46 Figura 37 Formul rio de registo no sistema ThermInfo ccccccccccccceceeeeeeeseeeeeeseseees 47 Figura 38 Diagrama de Colabora o do Caso de Uso Registar uma conta 48 Figura 39 Formul rio que permite a entrada no sistema
65. elopments will include the prediction of other molecular properties and the search of new estimation procedures based on structure energetics relationships and machine learning methods The knowledge obtained during the project will be published on an interactive website making it a valuable resource For chemical engineers and researchers Li WSC ose b Figura 18 P gina Principal do sistema Therminfo a Menu de funcionalidades dispon veis para utilizadores e administradores b Menus de funcionalidades dispon veis para utilizadores c Apresenta o do ThermInfo e P gina de apresenta o da equipa do sistema ThermInfo About us Esta p gina Figura 19 apresenta os membros da equipa do sistema ThermInfo e respectivos contactos assim como as publica es relacionadas Esta equipa envolve uma colabora o entre pessoas das reas da Qu mica e da Inform tica Ee Capitulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas Wednesday July 8 2009 SF About Us Research Team Structural Search Mario J Silva E mail mis di fc ul pt Webpage http xldb fc ul pt mis Contact Us Francisco Couto E mail fcouto di fc ul pt Webpage http xldb di fc ul pt wiki Francisco Couto na Teixeira MSc Student FCUL E mail ateixeira lasige di fc ul pt Webpage hitp xidb lasige di
66. em adequada Figura 21 e 22 Security code Type only numerical characters Ignore letters and special characters Figura 20 C digo de seguran a CAPTCHA utilizado no sistema Therminfo em todas as funcionalidades disponiveis publicamente Search e methanal Name Search Please do not use wildcards Help Ea Type only numerical characters Ignore letters and special characters Security code The page at http xldb di fc ul pt says Figura 21 Aviso indicador de que o c digo de seguran a n o foi digitado Search metani JlNome en Please do not use wildcards Help Type only numerical characters Ignore letters and special characters Security code Invalid Security Code Make sure you typed only numerical characters Please try again Figura 22 Mensagem de erro quando o c digo inserido n o est correcto 37 Cap tulo 3 Metodologia e Implementa o 38 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e Pesquisa de compostos Para pesquisar um composto no sistema Therminjo o utilizador especifica num formul rio o s termo s e os par metros de pesquisa que pretende assim como o c digo de seguran a Estes dados s o recebidos pelo servidor que por sua vez realiza um pr processamento aos mesmos envia uma query base de dados e devolve o seu resultado ao utilizador Figura 23 2 Envia
67. enbabel org wiki 87 Cap tulo 5 Conclus es ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas o a implementa o e integra o de m todos de previs o de propriedades para se obterem estimativas de dados termoqu micos para compostos org nicos de interesse que ainda n o tenham sido analisados experimentalmente 29 30 The future of chemistry depends on the automated analysis of chemical knowledge combining disparate data sources in a single resource which can be analyzed using computational techniques to assess and build on these data Townsend et al 2004 88 Bibliografia ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Bibliografia 1 Chen W L Chemoinformatics Past Present and Future J Chem Inf Model 2006 46 2230 2255 2 Bachrach S M Chemistry publication making the revolution J Cheminformatics 2009 7 do1 10 1186 1758 2946 1 2 3 Sousa J A Quimio inform tica Conte dos que urge ensinar BSP Qu mica 2002 84 55 59 4 Engel T Basic Overview of Chemoinformatics J Chem Inf Model 2006 46 2267 2277 5 Gasteiger J E Handbook of Chemoinformatics From Data to Knowledge Wiley VCH Weinheim 2003 6 Linstrom P J Mallard W G Eds NIST Chemistry WebBook NIST Standard Reference Database Number 69 National Institute of Standards and Technology Gaithersburg MD l
68. ermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas forma a facilitar e a diminuir o n mero de erros na entrada dos termos a pesquisar o estado f sico a classe a subclasse e a fam lia aparecem sobre a forma de drop down menus com todos os valores contidos na base de dados para esse atributo e as caracter sticas sobre a forma de checkboxes podendo ser seleccionadas v rias caracter sticas em simult neo Os restantes campos de preenchimento manual pelo utilizador obedecem s mesmas regras e processamento enunciados na pesquisa simples Tuesday July 21 2009 Structural Searcher Compound Name Physical State All v Molecular Formula Please type Molecular Formula with atoms in CHXNOS X halogen order Wildcard represents one character Molecular Weight v SMILES Unique SMILES Class All v Sub Class All v Family All v Characteristic Alkane L Alkene Alkyne Arene Alcohol Ether Peroxide Aldehyde Ketone Carboxilic Acid J Ester Amine Hydrazine F Imine E Nitr e Isonitrile NOx F Amide L Thiol Thioether Polysulphide Thiocarbonyl L SOx L Halogen Radical Charges Ionic L Solvation Polymer Security code Type only numerical characters Ignore letters and special characters Figura 36 Formul rio de Pesquisa Estrutural no qu
69. ervations na 1 J B Pedley Thermochemical Data and Structures of Organic Compounds 1 1994 571 The page at http xldb di fc ul pt says EI y Do you really want to DELETE the compound a Delete Data Figura 44 Informa o sobre as propriedades estruturais e termoqu micas de um composto a remover da base de dados a Pedido de confirma o da opera o de remo o do composto da base de dados Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas importante salientar que em ambas as funcionalidades actualizar apagar estes dados n o s o apagados do sistema mas sim movidos para uma base de dados paralela n o dispon vel para as pesquisas dos utilizadores que alberga dados desactualizados Antes de cada opera o tamb m realizado um backup autom tico do conte do da base de dados utilizando a fun o mysqldump do MySQL isto criado um ficheiro com todos os comandos SQL que permitem restaurar a base de dados caso seja necess rio e Painel de Controlo A funcionalidade Pamel de Controlo est dispon vel apenas para os administradores do sistema Therminjo e permite monitorizar os utilizadores a evolu o da base de dados e a utiliza o das funcionalidades de pesquisa Relativamente aos utilizadores do sistema esta a funcionalidade que permite adicionar ou eliminar utilizadores que
70. es Heur sticas com base nos princ pios gerais de usabilidade tais como recomenda es e guidelines para o desenvolvimento de interfaces Web Algumas das recomenda es utilizadas foram as do World Wide Web Consortium W30 Nielsen e valida o de HTML Figura 53 Ao longo do desenvolvimento da interface Web foram efectuadas listagens de problemas de acordo com viola es s recomenda es mencionadas anteriormente Assim a interface final produto de uma aplica o iterativa destas recomenda es 22 26 32 35 Valid Markup Validation of http xldb di fc ul pt tools therminfo search php W3C Markup Validator Mozilla Firefox File Edit View History Bookmarks Tools Help v C A g v E http validator w3 org check uri http 3A 2F 2Fxidb di fc ul pt 2Ftools 2Ftherminfo 2Fsearch php charset detect automatically do LY 7 el Google o OSE yisiter ecting Starte atest neadiines ommon FINtING 5 UF jocainose LB Most Visited 49 Getting Started Latest Headli c UNIX Printing 44 10 10 4 19 localhost pdf z v Search S PDF WO Markup Validation Service Check the markip HTML XHTML of Web documents Jump To Congratulations Icons Source Listing Outline This document was successfully checked as XHTML 1 0 Transitional Result Passed Address http xldb di fe ul pt tools therminfo search php Modified undefined Server Apache 2 2 3 CentOS Size 6921 C
71. estrutura qu mica dos compostos encontra se representada bidimensionalmente no formato JPEG Peso Molecular a soma dos pesos at micos de todos os tomos que constituem a mol cula Indica quantas vezes uma mol cula mais pesada que a duod cima parte de um tomo de carbono 12 9 12 Estado F sico indica a situa o em que o composto se encontra no que diz respeito s suas propriedades e ao movimento das part culas dependendo da temperatura e press o 9 12 Pode dividir se em o Cristalino os compostos possuem tamanho e forma definidos porque os seus tomos est o muito pr ximos ligados por for as de coes o consider veis e possuem ligeira vibra o no que diz respeito sua posi o m dia o L quido os compostos possuem propriedades interm dias entre os s lidos e os gases o Gasoso a principal caracter stica dos compostos no estado gasoso a mobilidade dos seus componentes o que permite s subst ncias ocuparem todo o volume dos recipientes que os cont m O movimento desordenado e as for as de interac o entre as mol culas s o fracas 13 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e SMILES Simplified Molecular Input Line Entry System uma especifica o para descrever a estrutura qu mica das mol culas usando uma curta sequ ncia de caracteres American Standard Code for Information Interchange A
72. ethano CASRN 4744 47 2 Molecular Formula 9 CsH1g0 Molecular Weight 222 24 Physical State Crysta SMILES OCC 1 CO COCC CO CO C 10 Unique SMILES CH2 1 C CHI CI CH2 0 1 CH2 OH CH2 OH 0H CH2 OH CH2 0H Standard Molar Enthalpy of Formation Crystalline Phase kJ mol 1267 7 Error 5 0 Standard Molar Enthalpy of Formation Standard Molar Enthalpy of Formation Standard Molar Enthalpy of Phase Cha Liquid Phase kJ mol Gas Phase kJ mol nge kJ mol Error na Error na Solid Liquid Error n a Liquid Gas n a Error na Solid Gas n a Error na Observations 1 J B Ped Thermoc ture 1 4 Figura 35 Ficha de um composto contendo toda a informa o relativa s propriedades estruturais e termoqu micas assim como a s respectiva s refer ncia s 2 A Pesquisa estrutural permite especificar em maior detalhe a estrutura do composto de forma a limitar o n mero de resultados a obter Para isso disponibilizado um formul rio com os seguintes campos nome do composto CASRN f rmula molecular peso molecular sob a forma de intervalo maior menor ou igual ao valor especificado estado f sico SMILES USMILES classe subclasse fam lia e caracter sticas Figura 36 Nenhum dos campos de preenchimento obrigat rio isto o utilizador poder fazer as combina es de campos que entender De 45 Cap tulo 3 Metodologia e Implementa o Th
73. i o em a 58 Cap tulo 3 Metodologia e Implementa o 59 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Therminfo Simple Search Tutorial a gt ee 0 28 0 53 4 DB Searching by name The search term is the name provided for an entity based on the current recommendations of IUPAC It is not necessary to use a wildcard since the search already returns all the cornpounds that contain the string used as search term Searching by Molecular Formula The Molecular Formula identifies each constituent by its chernical symbol and indicates the number of atoms of each element in subscript after the chemical symbol The atorns are in CHXNOS X halogen order If you are unaware of the number of atoms of some elernent you should place an for each digit 2 9 For example if you write C H11 it wil search for molecular formulas with atoms of carbon 2 9 and 11 atoms of hydrogen Searching by Molecular ID Figura 49 Conte dos do manual de instru es do sistema ThermInfo a Tutoriais em video alusivos a descri o textual de como s o utilizadas as funcionalidades e Comunica o dos utilizadores com os Administradores Esta funcionalidade permite aos utilizadores a partir da interface o envio de mensagens aos administradores do sistema Therminjo Figura 50 Para isso o utilizador ter de preencher um formul rio que cont m campos para nom
74. istema ThermInfo Permite tamb m adicionar novos utilizadores que poder o inserir novos compostos org nicos no sistema Na Figura 6 est o representados os actores Utilizadores e Administradores que exercem o papel de utilizadores e a sua Interac o com os Use Cases ou seja as funcionalidades que o sistema tem dispon veis 24 25 O actor Administrador possui acesso a todos os Use Cases dispon veis podendo tamb m fazer o papel de Utilizador O actor Utilizador pode pesquisar e visualizar os dados dos compostos org nicos criar uma conta no sistema reportar erros nos dados e mediante login inserir novos dados 21 Cap tulo 3 Metodologia e Implementa o 22 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Reportar erros nos dados Wes Utilizador Pesquisar compostos Inserir novos compostos i extends Ho gt Utilizador Registado i Valida o de dados vi 3 extends qt Gest o dos dados KI Apagar Dados gt i ekani Administrador eeetee lt Inserir Dados gt Controlar a Utiliza o do Sistema Figura 6 Vis o global das funcionalidades do Therminfo em termos de actores e depend ncias entre Use cases 3 3 Base de Dados A estrutura da base de dados foi concebida para permitir o acesso r pido acomodar dados heterog neos e manter a integridade referencial dos mesmos O conjunto de dados cons
75. lementa o We never do anything well till we cease to think about the manner of doing it William Hazlitt Ao longo deste capitulo ser apresentada a metodologia utilizada no desenvolvimento do sistema Therminjo e os detalhes da sua implementa o Inicia se com o levantamento do contexto do problema e uma an lise de requisitos do p blico alvo e das funcionalidades do sistema tamb m apresentada a descri o e implementa o da base de dados tal como da interface do sistema 3 1 An lise do Problema Nesta etapa foram realizadas reuni es e entrevistas com potenciais utilizadores do sistema e analisada a documenta o existente de forma a clarificar o problema e discutir propostas de resolu o 22 Tal como foi descrito no Cap tulo 1 necess rio o desenvolvimento de modelos de dados adequados s necessidades do Grupo de Energ tica Molecular Centro de 17 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Qu mica e Bioqu mica e da comunidade termoqu mica de forma a armazenar e partilhar os dados descritos no Cap tulo 2 process los e disponibilizar informa o que possa ser visualizada em formato coerente O sistema tamb m dever permitir uma gest o de dados adequada e a coopera o entre investigadores da rea 3 2 An lise de Requisitos Esta etapa tem como principais objectivos validar e sin
76. lis 2000 91 Bibliografia 92 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 35 Shneiderman B Designing the user interface strategies for effective human computer interaction Addison Wesley New York 1997 36 Trewavas A A Brief History of Systems Biology The Plant Cell 2006 78 2420 2430 Anexos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas ANEXO I Tabela de dados utilizada para realizar a avalia o de usabilidade Utilizador I D 3 14 15 16 7 I8 I9 HO H1 H2 tarefa Tempo seg Facilidade tempo de aprendizagem Memoriza o 0 5 0 5 3 5 4 5 5 5 4 5 4 5 4 5 5 5 4 5 5 5 5 5 d 4 Satisfa o 0 5 Oo Nn Nn P Nn Nn aN E Nn P Oo aN 93 113 114 Hs 116 17 118 119 DO 21 P2 123 24 125 Q1 Anexos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas P n AIAJ Msi ana OA NO P nn O O as nn Gril NM N P n wm J a N J oO A sain ON ioe n n Nn 100 ON ol nN Nn J Nn P w Nn ioe Nn 100 NO Nn 94 Q2 Q3 Q4 Q5 Q6 Q7 Q8 Q9 Q10 Q11 Q12 Q13 Q14 Anexos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Oo
77. m inserir dados de compostos organicos a Utilizadores que se registaram e se encontram em lista de espera para inser o na base de dados b Utilizadores registados com acesso funcionalidade de inser o de dados De forma a monitorizar a evolu o da base de dados o administrador tem a possibilidade de visualizar um quadro que apresenta no momento qual o n mero total de compostos existentes na base de dados assim como o n mero de propriedades estruturais e termoqu micas existentes Figura 46 Database Statistics Enthalpies Total SMILES Chemical Structure Classes Sub Classes Families M Crys Lig Gas Lig Gas 2956 2956 6 a 459 1365 1461 1740 1646 Figura 46 Estat sticas da base de dados numero total de compostos sublinhado a cor de laranja n mero de SMILES estruturas qu micas e entalpias presentes assim como o n mero de classes subclasses e fam lias diferentes existentes na base de dados Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Para monitorizar o uso das funcionalidades de pesquisa apresentado um quadro com as estat sticas para o n mero de pesquisas realizadas Figura 47 a Este quadro apresenta o n mero total de pesquisas realizadas assim como os subtotais para cada ano linhas para os doze meses do ano colunas e para o cruzamento destes dois factores c lula de cruzamento dos dois
78. minada classe ou fam lia Se as mesmas estiverem escritas de diferentes formas v o ser interpretadas como sendo classes ou fam lias diferentes Este problema tamb m poder por em causa a unicidade dos dados Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Da td 9 Dados Estruturais CO v1_1 Modo de Compatibilidade Microsoft Excel ca Inicio Inserir Layout da P gina F rmulas Dados Revis o Exibi o o E e Arial jio A IE Quebrar Texto Automaticamente Geral 7 zy cm RO ae A A Bee Fry De A Colar p Nilo Em Sr i di M E kad Mesclar e Centralizar 000 br 88 Formata o Formatar Estilos de Inserir Excluir Formatar gt Classificar Localizar Condicional como Tabela C lula e Filtrar Selecionar rea de T Fa Fonte Fa Alinhamento Ta N mero Ta Estilo C lulas Edi o G2 an Se x Alkane Alkene Alkyne Arene Alcohol Ether Peroxide Amine Hydrazine Imine Nitrile Isonitrile NOx Aldehyde Ketone Carboxylic AcidEster Amide Thiol ThioetherPolysulphideThiocarbonyl SOx Halogen Solvation Charges lonic Polyr q X 1 310 311 312 313 314 315 316 317 318 319 320 321 xxx gt lt gt lt gt lt gt lt xxx x xx 322 323 324 x KKK KKK KKK i i x x IKK KK KK I x I I SETE TES xxx x x x KKK KKK KK KK Figura 2 Armazenamento
79. mo da Informa o e a possibilidade de consultar mais informa o visualiza o da ficha do composto Figura 15 Figura 14 Prot tipo de baixa fidelidade para a listagem de resultados obtida quando realizada uma pesquisa de um composto simples ou estrutural Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Figura 15 Prot tipo de baixa fidelidade para a ficha de um composto 32 Cap tulo 3 Metodologia e Implementa o 33 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e P gina de Inser o de dados Figura 16 Prot tipo de baixa fidelidade para a p gina de inser o de dados no sistema Nesta p gina apresentado o formul rio com os campos de inser o de todos os dados do composto Figura 16 e P gina de Actualiza o Elimina o de dados Figura 17 Prot tipo de baixa fidelidade para a p gina de actualiza o elimina o de dados no sistema Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Esta pagina Figura 17 apresenta um campo para especificar o ID do composto a ser eliminado ou actualizado No caso do objectivo ser a elimina o a ficha do composto apresentada e utilizador ter de confirmar a sua elimina o Se o objectivo for a actualiza o ser apre
80. mpounds Interface usability results show that it is easy to use and fast to learn which improves the efficiency when employing the system The development of this work suggests some future directions that will expand the capabilities of the ThermInfo including the expansion of the data set the integration of other classes of compounds databases and chemoinformatics tools that enable a combination of a structure drawn with textual search terms and prediction methods of thermochemical properties Keywords Chemoinformatics Information System Database Web Interface Thermochemical Properties Agradecimentos Embora uma disserta o tenha como caracter stica ser um cunho reflexivo te rico individual h contributos de naturezas diversas que n o podem deixar de ser real ados Entre eles a amizade a compreens o e a colabora o de v rias pessoas Por essa raz o expresso os meus sinceros agradecimentos ao meu orientador Professor Doutor Francisco M Couto por todo o optimismo com que sempre me apoiou e incentivou durante a realiza o deste trabalho ao meu co orientador Doutor Rui C Santos pela extrema dedica o e organiza o que sempre demonstrou por todo o apoio incentivo sugest es respeito e responsabilidade atribu dos ao meu trabalho aos 43 utilizadores que voluntariamente se disponibilizaram a realizar os testes de usabilidade e que construtivamente criticaram a interface do sistema ThermInfo
81. mula varchar 255 latinf swedish ci LIKE v E mol_char_outdated f E mol char temp mw decimal 2 v E mol image E mol image outdated state char 1 latinl swedish ci LIKE v E mol image temp i E reference smile varchar 255 latinf smwedish ci LIKE v E reference_outdated r l l E reference temp usmile varchar 255 latinf swedish ci LIKE v E subclass a amp subclass outdated family _int 11 v E RR class int 11 v amp user temp Figura 9 Utiliza o do phpMyAdmin para realizar queries SQL base de dados do sistema ThermInfo Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas A interface foi desenvolvida utilizando PHP que uma linguagem de programa o server side processada no servidor desenvolvida especialmente para a Web com a possibilidade de ser embebida em c digo HTML O PHP est muito bem documentado suporta transac es intensivas executa r pido funciona bem com outros softwares escolhidos para o desenvolvimento deste projecto o MySQL e Javascript JS A escolha do PHP permitiu tamb m utilizar Dynamic Hyper Text Markup Language DHTML para fornecer e actualizar na Interface informa o armazenada na base de dados 26 O controlo de acesso s fun es administrativas realizado utilizando a funcionalidade hypertext access htaccess do servidor Apache O Therminfo encontra se ofici
82. n sculas devido s regras de concep o de um SMILES 14 Para realizar esta pesquisa case sensitive utilizado o COLLATE latin bin do MySQL Em termos de interface quando o tipo de pesquisa SMILES seleccionado apresentada uma Instru o de pesquisa que indica que esta pesquisa case sensitive assim como uma liga o sec o de ajuda deste tipo de pesquisa Figura 33 CC JET ES SMILES the search is case sensitive Help Figura 33 Formul rio da Pesquisa Simples por SMILES particularidade da Figura 24 Todos os tipos de pesquisa dispon veis t m hiperliga es para a respectiva sec o de Help Os resultados da pesquisa s o apresentados ao utilizador sob a forma de listagem ordenada por relev ncia isto de acordo com a dist ncia do termo de pesquisa ao in cio da string dos termos encontrados Esta listagem inclui a Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas informa o relativa ao nome do composto f rmula molecular ID molecular CASRN e SMILES para cada dos compostos encontrados S o apresentados no m ximo 100 compostos contudo o n mero real de compostos que satisfazem as condi es da pesquisa apresentado Figura 34 About Us Sea FC h Help Search Hame v Structural Search Please do not use wildcards Help Insert Data Security code
83. nfo phpMyAdmin 26 Figura 9 Utiliza o do phpMyAdmin para realizar queries ao sistema ThermInfo 26 Figura 10 Modelo simplificado do funcionamento do sistema Therminio 28 Figura 11 Prot tipo de Baixa Fidelidade para a p gina de entrada no sistema 29 Figura 12 Prot tipo de Baixa Fidelidade para a p gina de pesquisa de compostos 30 Figura 13 Prot tipo de Baixa Fidelidade para a p gina de pesquisa avan ada 31 Figura 14 Prot tipo de Baixa Fidelidade para a listagem de resultados 31 Figura 15 Prot tipo de Baixa Fidelidade para a ficha de um composto 32 Figura 16 Prot tipo de Baixa Fidelidade para a p gina de inser o de dados 33 Figura 17 Prot tipo de Baixa Fidelidade para a p gina de actualiza o elimina o 33 Figura 18 Pagina Principal do sistema Therminjo sssr 35 Figura 19 P gina de apresenta o da equipa do sistema ThermInfo 00000c00e 36 Figura 20 C digo de seguran a utilizado no sistema ThermInfo n s 37 1V Figura 21 Aviso indicador de que o c digo de seguran a n o foi digitado 37 Figura 22 Mensagem de erro quando o c digo inserido n o esta correcto 37 Figura 23 Diagrama de Colabora o do Caso de Uso Pesquisar um Composto 38 Figura 24 P gina de Pesquisa Simples cccceeeeeeee
84. nimais ou vegetais 9 12 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Estes compostos s o de extraordin ria import ncia existem em elevado n mero devido s caracter sticas especiais do tomo de carbono as suas mol culas podem atingir grandes dimens es e complexidade e s o a base de todos os seres vivos e de um grande numero de produtos 9 12 Tal como ja foi referido anteriormente o sistema Therminjo cont m dados relativos a compostos org nicos que podem ser divididos em tr s categorias 1 Dados Estruturais constitu dos por descritores que especificam a estrutura molecular dos compostos mostrando a forma como os tomos est o ligados o tamanho da mol cula e outras propriedades Os dados estruturais podem reunir e sistematizar um elevado n mero de caracter sticas relativos a centenas de milhares de compostos diferentes 9 12 e Identity Descriptor ID Molecular um identificador nico para cada um dos compostos atribu do pelo sistema Therminjo Este ID tem o formato CONNNNN N um d gito e Nome do Composto o nome atribu do a cada um dos compostos baseado numa nomenclatura sistem tica de acordo com as recomenda es da International Union of Pure and Applied Chemistry IUPAC 13 e CAS Registry Number CASRN um identificador nico institu do e atribu do a cada subst ncia qu mica pelo CAS Est
85. nore letters and special characters Figura 50 Formul rio para o envio de mensagens aos administradores do ThermInfo Esta funcionalidade muito importante n o s para receber quest es coment rios dos utilizadores mas tamb m porque permite que a comunidade cient fica participe no processo de avalia o da qualidade dos dados disponibilizados pelo sistema ThermInfo 3 5 3 Avalia o de Usabilidade As v rias t cnicas de avalia o de usabilidade assim como os resultados obtidos ser o apresentados no Cap tulo seguinte No entanto importante referir que ao longo da implementa o da interface apresentada neste Cap tulo foram tidos em considera o princ pios e testes de usabilidade de uma forma iterativa 25 27 28 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Avalia o Make everything as simple as possible but not simpler Albert Einstein O Sistema de Informa o Therminjo foi desenvolvido e os dados estruturais e termoqu micos de compostos org nicos foram inseridos e categorizados na base de dados Estes dados foram compilados da literatura e avaliados criticamente pelo Grupo de Energ tica Molecular Centro de Qu mica e Bioqu mica Actualmente o sistema ja se encontra apto para receber novos dados de compostos org nicos inseridos por Investigadores na rea da termoqu mica que se encontrem registad
86. olecular quer o CASRN s o nicos as entidades class subclass e family t m como atributo o respectivo nome Cada composto ter uma class subclass e family Cada class subclass e family podem ser atribu das a v rios compostos molecule a entidade characteristic tem como atributo o nome da caracter stica e a chave prim ria atribu da incrementalmente Cada composto poder ter v rias characteristic assim como cada characteristic pode pertencer a v rios compostos De forma a melhorar a performance das opera es de selec o de dados nesta rela o de muitos para muitos as colunas foram 10 indexadas a entidade image tem como atributo a pr pria imagem do composto Cada composto apenas poder ter uma imagem e cada imagem corresponde a um nico composto Dentro da categoria dos dados termoqu micos temos uma entidade data que tem 9 atributos os valores das entalpias e respectivos erros descritas no Capitulo 2 Cada composto ter apenas um valor de cada um dos atributos desta entidade Esta categoria tamb m se relaciona com os dados bibliogr ficos reference sendo que os dados termoqu micos poder o ter v rias refer ncias bibliogr ficas Mais uma vez de forma a melhorar a performance das opera es de selec o de dados nesta rela o de muitos para muitos as colunas foram indexadas Dentro da categoria dos dados bibliogr ficos temos uma entidade reference que tem 5 atribu
87. on veis e Pesquisa Simples pesquisa os compostos com base num termo de pesquisa e no tipo de pesquisa seleccionado Dada a natureza dos dados ser relevante fazer uma pesquisa deste tipo com base no ID nome f rmula molecular CASRN ou SMILES do composto Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas e Pesquisa Estrutural pesquisa os compostos com base na utiliza o de v rios termos de pesquisa correspondentes estrutura da mol cula restringindo assim os resultados que v o ser obtidos Uma pesquisa com sucesso utilizando um destes dois m todos dever apresentar e Uma lista de resultados com o resumo da informa o sobre o composto ID nome f rmula molecular CASRN e SMILES ordenada de acordo com a relev ncia para o s termo s de pesquisa e Uma ficha por composto com toda a informa o organizada de uma forma estruturada e coerente quando tal for desejado pelo utilizador atrav s de uma hiperliga o existente na lista de resultados Funcionalidades Administradores pipa Utilizadores Pesquisa Simples 4 4 JS Pesquisa Estrutural 4 S 4 Reportar Erros nos Dados Jf 4 JS Inser o de Dados 4 S X Actualiza o de dados AS X X Elimina o de dados AS X X Valida o de dados inseridos X X Controlo do Sistema v X X Figura 5 Funcionalidades disponibilizadas pelo sistema ThermInfo aos diferentes tipo
88. ontent Type text html Encoding utf 8 detect automatically v Doctype XHTML 1 0 Transitional detect automatically v Root Element html Root Namespace http Awwww3 org 999 xhtml Figura 53 Verifica o do c digo HTML num sistema de valida o do W3C De todas as recomenda es existentes foram tidas em especial aten o as seguintes e Visibilidade do sistema utilizando mensagens adequadas para transmitir os erros Figura 54 W3C http www w3 org 17 Guidelines para desenvolvimento de interface Web de Nielsen http www useit com alertbox 8 Valida o de HTML W3C http validator w3 org gt 66 Cap tulo 4 Avalia o 67 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Search CASRN format NNNWAWA NAA N 1 7 digits hyphen 2 digits hyphen 1 digiti Help Type only numerical characters Ignore letters and special characters Security code Invalid CAS registry number format 123 2 1 Make sure the CAS registry number you have entered matches the standard format NNNNNNN NM N 1 7 digits hyphen 2 digits hyphen 1 digit Figura 54 Apresenta o de mensagens adequadas para transmitir erros e Permitir a navega o dentro e entre p ginas deixando sempre vis vel o menu lateral que faz liga es a outras funcionalidades do ThermInfo e Consist ncia ao longo da interface utilizando sempre
89. opriedades Termoquimicas erros cometidos foram n o ter em conta que a pesquisa por SMILES case sensitive apesar do aviso presente na p gina n o inserir o c digo de seguran a ou inseri lo com os n meros e letras na realiza o de pesquisas e tentativa da realiza o da pesquisa estrutural na funcionalidade de pesquisa simples Devido ao facto do n mero de erros cometidos ter sido muito baixo e eles serem de f cil recupera o percep o estes testes n o foram realizados Utilizador Mi Oa 70 0 a fo Q z 40 0 Percentagem de Utilizadores 8 Q se N Q EM 10 0 50 0 a fo L Ss EN oO z 40 0 w i S oS w O E rercentagem ae UlllIZaQgores Percentagem de Utilizadores N Q ON N Q oS 10 0 10 0 Satisfa o Memoriza o Figura 59 Distribui o da percentagem de utilizadores pelas pontua es escala 0 5 atribu das aos tr s atributos de usabilidade facilidade satisfa o no uso e facilidade de memoriza o I utilizadores experientes no uso de Tecnologias de Informa o e Q utilizadores experientes na rea da Qu mica Tarefa 1 pesquisa simples Tarefa 2 pesquisa estrutural Tarefa 3 inser o de dados 82 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas As medidas subjectivas da opini o dos utilizadores relativamente aos tr s atributo
90. or R D Kirby S P Thermochemical Data of Organic Compounds 2nd ed Chapman and Hall London 1986 17 Pedley J B Thermochemical Data and Structures of Organic Compounds TRC Data Series vol 1 College Station TX 1994 18 Martinho Simoes J A Minas da Piedade M E Molecular Energetics Condensed Phase Thermochemical Techniques Oxford University Press New York 2008 19 Frurip D Britton L Fenlon W Going J Harrison B K Niemeier J Ural E A The Role of ASTM E27 Methods in Hazard Assessment Part I Thermal Stability Compatibility and Energy Release Estimation Methods Process Saf Progr 2004 23 266 278 20 Louren o J A A Diogo H P Minas da Piedade M E Safety in the chemical industry desk screening thermoanalytical and calorimetric methods for thermal hazard evaluation Engenharia Qu mica 2006 3 27 35 21 Poling B E Prausnitz J M O Connell J P The Properties of Gases and Liquids 5th ed McGraw Hill Singapore 2001 22 Nielsen J Usability Engineering AP Professional Mountain View EUA 1993 90 Bibliografia ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 23 Ramakrishnan R Gehrke J Data Management Systems 3rd ed McGraw Hill 2003 24 Booch G Rumbaugh J Jacobson I The Unified Modeling Language User Guide Addison Wesley Longman MA 1999 25 Dix A Finlay J Abowd G D B
91. os no sistema 4 1 Base de Dados As estat sticas da base de dados em Julho de 2009 podem ser visualizadas na Figura 51 A sua observa o permite verificar a representatividade do conjunto de dados Presentemente existem cerca de 3000 compostos org nicos nicos e n o redundantes com todos os dados descritos anteriormente dispon veis A an lise do histograma mostra que os 2956 compostos est o divididos por 6 classes 12 subclasses e 489 fam lias est o dispon veis mais de 1300 valores de entalpias para cada um dos 3 6l Cap tulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas estados f sicos transi o de estado sendo que a entalpia de forma o no estado gasoso cont m o maior n mero de dados 1740 Estat sticas da Base de Dados 2956 2956 2956 a Ke m U Ke Vv a co c a o A oo u he u Ee Oo i U E 5 a Entalpias Figura 51 Representa o gr fica das estat sticas da base de dados numero de compostos na base de dados que cont m as diferentes categorias Foi efectuada uma avalia o ao desempenho das consultas inser es realizadas sobre a base de dados para as funcionalidades dispon veis aos utilizadores em geral pesquisa simples pesquisa estrutural e inser o de dados O desempenho foi medido a partir da recolha do tempo necess rio para a execu o de cada query m dia de 5
92. over o cursor at ao composto pretendido P 39 Clicar no bot o View B 40 Resposta do sistema R 0 12 segundos Para calcular o tempo de execu o esperado foram substitu dos os comandos pelos tempos estimados para a sua execu o Tabela 2 Obteve se texecu o 0 4 1 35 1 1 0 2 1 35 1 1 0 4 1 35 9 0 28 0 4 1 35 1 1 0 2 1 35 1 1 0 4 1 35 0 28 0 28 0 4 1 35 1 1 0 2 1 35 1 1 0 2 1 35 1 1 0 2 0 4 1 35 6 0 28 0 4 1 35 1 1 0 2 0 13 1 354 1 1 0 2 0 12 35 31 segundos Objectivo Inser o de um composto de CASRN 10025 87 3 e quatro campos Nome do composto methylene Peso molecular 30 Estado f sico crystal Caracter stica polymer Ac es 1 Mover a m o para o rato H 2 Prepara o Mental M 3 Mover o cursor do rato at Insert Data P 4 Carregar no bot o do rato B 5 Prepara o Mental M 6 Mover o cursor at caixa do CASRN P 7 Carregar no bot o do rato B 8 Mover a m o para o teclado H 9 Prepara o Mental M 10 Digitar o CASRN do composto 10025 87 3 10K 11 Mover a m o para o rato H 12 Prepara o Mental M 13 Mover o cursor at caixa do nome do composto P 14 Carregar no bot o do rato B 15 Mover a m o para o teclado H 16 Prepara o Mental M Capitulo 4 Avalia o 72 ThermInfo Sistema de Informa o para Coligi
93. plementa o Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Cap tulo 4 apresenta e discute os resultados alcan ados que permitem avaliar a base de dados e a interface implementadas Cap tulo 5 s o expostas as principais conclus es deste trabalho e direc es futuras 10 Cap tulo 2 Conceitos B sicos ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Conceitos B sicos If we knew what it was we were doing it would not be called research would it Albert Einstein No Capitulo 1 foi discutida a motiva o para a constru o de um Sistema de Informa o para coligir e apresentar propriedades estruturais e termoquimicas de compostos org nicos e as vantagens que este pode oferecer quando comparado com os m todos de armazenamento e consulta anteriormente utilizados Neste Cap tulo ser dada uma vis o geral sobre as propriedades dos compostos org nicos presentes no sistema Therminjo e a sua Import ncia 2 1 Compostos Org nicos Denominam se por compostos org nicos os compostos qu micos que s o constitu dos por tomos de carbono hidrog nio e por vezes tamb m por outros elementos como o oxig nio o azoto o enxofre os halog neos e o f sforo 9 12 A maioria destes compostos obt m se por s ntese embora a maneira mais f cil de os obter seja isola los a partir de produtos a
94. pon veis que se mant m nas restantes interfaces e uma apresenta o do sistema ThermInfo e P gina de Pesquisa E EA NOLE CUY LAR Tor pd LIA MILES CAE RI sF amp 4 S amp C Nuon CL a BE Figura 12 Prot tipo de baixa fidelidade para a p gina de pesquisa de compostos no sistema A p gina de pesquisa apresenta um menu lateral com as diversas funcionalidades dispon veis e tr s possibilidades de pesquisa 1 Pesquisa de um composto com base num termo de pesquisa e do par metro de pesquisa seleccionado de uma listagem Figura 12 a 2 Pesquisa com base num intervalo de valores relativos aos dados termoqu micos entalpias dos diversos estados f sicos Figura 12 b Este tipo de pesquisa foi considerado pelo p blico alvo sem interesse para o seu trabalho Cap tulo 3 Metodologia e Implementa o 31 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 3 Pesquisa avan ada Figura 13 que permite especificar diversas caracter sticas estruturais do composto Foi denotado que a sua aus ncia no menu de funcionalidades poderia causar alguma entropia para al m de sobrecarregar a p gina de pesquisas simples Figura 12 c Figura 13 Prot tipo de baixa fidelidade para a p gina de pesquisa avan ada de compostos no sistema Ambas as pesquisas simples e estrutural obt m um conjunto de resultados Figura 14 sob a forma de listagem com um resu
95. propriedades estruturais e termoqu micas de compostos org nicos Este Sistema de Informa o foi baptizado de ThermInfo 1 3 Objectivos O Sistema de Informa o que se preconiza utiliza o conjunto de dados estruturais e termoqu micos de base recolhido e criticamente avaliado pelo Grupo de Energ tica Molecular Os principais objectivos s o organizar e disponibilizar essa informa o de forma estruturada coerente e simples permitindo a coopera o entre a comunidade cient fica e a evolu o ao longo do tempo com a possibilidade de integrar m todos estat sticos e de previs o de propriedades asssm como outros tipos de ferramentas Como objectivos espec ficos este trabalho tem as seguintes fases e Compreender as necessidades dos utilizadores e de que forma este Sistema de Informa o pode potenciar e facilitar as tarefas de pesquisa e organiza o de dados termoqu micos de compostos org nicos e Analisar os requisitos desta ferramenta para compilar e apresentar dados termoqu micos e estruturais de forma adequada tendo em conta os utilizadores e Implementar e avaliar a ferramenta tendo em conta os aspectos mencionados acima Capitulo 1 Introdu o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 1 4 Metodologia Este projecto recorre s tecnologias de informa o e procura responder simultaneamente s necessidades de armazenamento manipula o e visualiza
96. r e Apresentar Propriedades Termoquimicas 17 Digitar o nome do composto methylene 9K 19 Mover a m o para o rato H 20 Prepara o Mental M 21 Mover o cursor at caixa do peso molecular P 22 Carregar no bot o do rato B 23 Mover a m o para o teclado H 24 Prepara o Mental M 25 Digitar o peso molecular 30 2K 26 Mover a m o para o rato H 27 Prepara o Mental M 28 Mover o cursor at caixa da escolha do estado f sico P 29 Clicar no estado f sico pretendido crystal B 30 Prepara o Mental M 31 Mover o cursor at checkbox correspondente caracter stica polymer P 32 Clicar na checkbox B 33 Prepara o Mental M 34 Mover o cursor at ao bot o Add Data P 35 Clicar no bot o Add Data B 36 Resposta do sistema R Para calcular o tempo de execu o esperado foram substitu dos os comandos pelos tempos estimados para a sua execu o Tabela 2 Obteve se texecu o 0 4 1 35 1 1 0 2 1 35 1 1 0 2 0 4 1 35 10 0 28 0 4 1 35 1 1 0 2 0 4 9 0 28 1 35 0 28 0 28 0 4 1 35 1 1 0 2 1 35 1 1 0 2 1 35 1 1 0 2 0 37 26 85 segundos Tabela 3 Quadro resumo dos tempos de execu o totais em segundos para cada uma das tarefas delineadas com base no modelo KLM GOMS Tempo de Tarefa execu o total segundos Pesquisa Simples 24 08 Pesqui
97. rutural Tarefa 3 inser o de dados A an lise do gr fico para o grupo de utilizadores experientes na utiliza o de Tecnologias de Informa o I revela que a tarefa 1 pesquisa simples tem uma amplitude superior s restantes tarefas e uma distribui o ligeiramente assim trica relativamente mediana as tarefas 1 e 2 pesquisa estrutural apresentam uma amplitude e mediana id nticas exceptuando para o limite inferior que mais elevado para a tarefa 2 16 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas a tarefa 3 Inser o de dados tem uma mediana Inferior s restantes a distribui o do tempo que os utilizadores demoram a realizar cada uma das tarefas 2 e 3 aproximadamente sim trica relativamente mediana A an lise do gr fico para o grupo de utilizadores experientes na rea da Qu mica Q revela que a tarefa 1 e 2 t m uma amplitude superior tarefa 3 a tarefa 1 apresenta o valor de mediana mais baixo e uma distribui o assim trica a tarefa 3 apresenta uma distribui o assim tica relativamente mediana e 50 dos valores centrais da distribui o zona interquartil encontram se abaixo do valor da mediana existem 2 outliers valores fora da amplitude da amostra para as tarefas 2 e 3 com tempos de execu o muito elevados Comparando os dois grupos de utilizadores relativamente a
98. s o verificados se efectivamente s cont m n meros CASRN verificado o formato e o d gito controlo estado f sico classe subclasse e fam lia podem ser seleccionadas de uma lista para evitar erros de digita o no entanto existe a op o de adicionar uma fam lia n o existente na lista a estrutura qu mica pode ser adicionada sob a forma de imagem JPEG as caracter sticas da mol cula s o seleccionadas em checkboxes e as refer ncias bibliogr ficas podem ser estendidas at seis Monday July 27 2009 e Structural Data Compound CASRN qr Molecular Weight a piysialstete Ay SMILES Unique SMILES Class Any h Sub Class Any v Family Any E Characteristic E alkane T Alkene T Alkyne E Arene T Alcohol E Ether E Peroxide EIA dehyde Ketone carboxilic acid E Ester E amine E Hydrazine E imine E nitrile tsonitrile E nox F Amide E Thiol E thioether E Polysulphide E Thiocarbonyl sox E Halogen E Radical E Charges E tonic E Solvation E Polymer Thermochemical Data Standard Molar Enthalpy of Formation Crystalline Phase kJ mol Error Standard Molar Enthalpy of Formation Liquid Phase kJ mol Error Standard Molar Enthalpy of Formation Gas Phase kJ mol Error Standard Molar Enthalpy of Phase Change kJ mol Error Observations Author Journak Year Volume Page More References 0 v Add Data Figura 40 Formul rio que permit
99. s de usabilidade facilidade de aprendizagem memoriza o da forma como as tarefas s o realizadas e satisfa o do uso obtiveram resultados bastante bons Em ambos os grupos a pontua o m dia foi superior a 4 Tabela 4 e a distribui o das pontua es pelos utilizadores de ambos os grupos encontra se representada na Figura 59 De forma geral os utilizadores comentaram que numa utiliza o posterior do sistema n o cometeriam os mesmos erros e que a similaridade e simplicidade dos formul rios facilitavam bastante o uso e a memoriza o necess ria de como s o realizadas as tarefas As principais sugest es realizadas pelos utilizadores foram os avisos deveriam ser mais vis veis utilizando uma letra de tamanho superior ou cores diferentes deveria ser implementado o uso de wildcards na pesquisa por f rmula qu mica e as caracter sticas deveriam estar ordenadas de uma forma mais intuitiva Todos os resultados coment rios e sugest es obtidos neste processo de avalia o foram tidos em conta para aperfei oar as funcionalidades j implementadas e a implementar futuramente no sistema ThermlInfo 83 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Cap tulo 5 Conclus es ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Conclusoes What you get by achieving your goals is not as important as what you become by
100. s de utilizadores O preenchimento da c lula com um visto indica que a funcionalidade est dispon vel para esse tipo de utilizador 20 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 2 Gerir os dados dos compostos e Reportar Erros nos Dados dispon vel para todos os utilizadores permite reportar aos administradores do sistema Therminfo poss veis erros nos dados existentes na base de dados e Inserir dados permite aos utilizadores registados a Inser o de novos dados para compostos org nicos no sistema Therminfo Esta funcionalidade pressup e o registo e login no sistema tal como a posterior valida o dos dados inseridos por um administrador O principal objectivo desta fun o a de apoiar a expans o da base de dados por parte da comunidade termoqu mica e Apagar Actualizar dados permite aos administradores pesquisar por um composto com dados suspeitos ou desactualizados e proceder sua remo o ou actualiza o na base de dados do sistema Therminio e Validar dados permite aos administradores validar os dados relativos a compostos inseridos por utilizadores registados Esta funcionalidade permite manter controlada a qualidade e a consist ncia termodin mica dos dados disponibilizados pelo sistema e Controlar o Sistema permite aos administradores monitorizar a evolu o e o uso da base de dados do s
101. s este projecto integra quatro fases de desenvolvimento interdependentes e complementares percep o an lise do problema e de requisitos concep o modela o do sistema implementa o e avalia o do sistema O Sistema de Informa o foi denominado Therminjo e encontra se dispon vel em http www therminfo com Este sistema integra uma base de dados baseada numa especifica o de dados relacional para descrever propriedades estruturais e termoqu micas de compostos org nicos A sua interface Web de f cil utiliza o permite a realiza o de pesquisas inser o de novos compostos e gest o dos dados Presentemente o Therminjo cont m valores de propriedades termoquimicas experimentais criticamente avaliados e termodinamicamente consistentes para cerca de 3000 compostos nicos e n o redundantes Os resultados da avalia o de usabilidade da Interface mostram que f cil de usar e de r pida aprendizagem o que melhora a efici ncia do uso do sistema O desenvolvimento deste trabalho sugere algumas direc es futuras que ir o ampliar as capacidades do sistema Therminfo nomeadamente a expans o do conjunto de dados integrando bases de dados de outras classes de compostos qu micos e a Incorpora o de ferramentas quimio inform ticas que possibilitem a combina o de uma estrutura desenhada pelo utilizador com os termos de pesquisa e m todos de previs o de propriedades termoqu micas Palavras Chave Quimio informa
102. s temp Jf 2 g mid int 11 No auto_increment E m X DR it class tem S j pm a rd O data S Q molid varchar 255 latinf swedish ci Yes NULL Em x o E Spa El Soee out oeee O casm varchar 20 latin swedish ci Yes NULL E if x ih A E data ref outdated O data ref O name varchar 255 _latin1_swedish_ci ves NULL EE x Z e ii O data ref outdated O formula varchar 255 latinf swedish ci Yes NULL E il x DB E E family O data ref temp O mw decimal 7 2 Yes NULL BE x E Er i A E data temp E O state char 1 latinf swedish ci Yes NULL E E x o R ir E image ue O family Es smile varchar 255 latin swedish ci Yes NULL E E x D A aaa family outdated z O usmile varchar 255 latin swedish ci Yes NULL EE x D F E molecule O family temp E a O family int 11 Yes NULL E E x DD fA Er E molecule outdated O E E x FE E mol char image outdated t_ Check All Uncheck All With selected xX EM E mol char outdated O image temp 7 Bene ald T are ES Print view ga Propose table structure E mol image outdated a Ze Add field s At End of Table At Beginning of Table o After mi E mol image temp O molecule outdated jz 8 o 2 Sus the amp reference 5 E reference outdated O molecule_temp So Indexes Space usage Row Statistics p lap a O mol char Es E Keyname Type Cardinality Action Field Type Usage Statements Value E subclass outdated O mol char outdated PRIMARY PRIMARY 2956 E X mid Data 487 000 B Format dynamic aa E O mol
103. s vari ncias 01 or Tabela 6 Valores de p value obtidos para os testes de Levene e t Student Tarefa p value teste de Levene p value teste t Student 0 772 0 787 2 0 662 0 923 3 0 567 0 848 ay Tarefa 1 pesquisa simples Tarefa 2 pesquisa estrutural Tarefa 3 inser o de dados Para o teste de Levene os p values obtidos Tabela 6 s o todos muito elevados pelo que para qualquer n vel de signific ncia n o se rejeita a hip tese de que as vari ncias s o Iguais Assim considera se que as vari ncias populacionais embora desconhecidas s o Iguais Assim podemos considerar v lida a aplica o do teste t Student para comparar os dois grupos de amostras Os resultados deste teste encontram se especificados na Tabela 6 Todos os p values obtidos s o muito elevados pelo que para qualquer n vel de signific ncia n o se rejeita a hip tese de que n o existem diferen as entre as m dias 19 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas do desempenho em cada grupo Logo considera se que a forma o profissional n o interfere com o desempenho com que os utilizadores realizam as tarefas na interface Tabela 7 Valores de tempo para desempenhar uma tarefa esperados segundo o modelo KLM GOMS e a m dia de tempo realmente obtidos em cada um dos grupos de utilizadores e tarefas a desempenhar Tempo esperado Tempo obtido Grupo T
104. sa Estrutural com base em 4 par metros 35 31 Inser o de um composto com 5 par metros 26 85 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas A an lise destes resultados Tabela 3 permite nos verificar que a execu o das tr s tarefas requer pouco tempo de execu o Obviamente que este tempo vai variar com diversos factores como por exemplo a experi ncia e destreza do utilizador o conhecimento da interface entre outros 2 Testes de usabilidade com utilizadores A avalia o de usabilidade com a participa o de utilizadores deu se em fases finais depois de se ter uma Interface funcional e teve como principais objectivos melhorar a ferramenta e identificar dificuldades na realiza o das tarefas por parte dos utilizadores Foram testadas tr s funcionalidades fulcrais e destinadas a utilizadores a pesquisa simples a pesquisa estrutural e a inser o de dados Com este prop sitos foram delineadas e apresentadas tr s tarefas aos utilizadores 1 Encontre a ficha do composto com SMILES CCCCCO Procedimento Esperado O utilizador clica em Search no menu lateral preenche a caixa de pesquisa com o termo CCCCCO selecciona o tipo de pesquisa SMILES preenche o c digo de seguran a apenas os d gitos clica no bot o Search e no primeiro composto da lista de resultados clica em View para visualizar a ficha do
105. se este n o existir na base de dados wednesday July 22 2009 Home About Us Search Structural Search Insert Data Help Contact Us About Us Search for a molecule to delete Search Structural Search Molecular ID cooo48 Search ot Dale Molecular ID format CONNNNN NNNNN 5 digits Administration Insert Data Update Data Delete Data Validate Data Control Panel Figura 42 Caixa de pesquisa por ID molecular de um composto a apagar Se a funcionalidade pretendida for a actualiza o dos dados do composto apresentado um formul rio id ntico ao da funcionalidade de inser o de dados No entanto os dados dispon veis para esse composto s o carregados nos respectivos campos do formul rio Assim podem ser selectivamente alterados adicionados ou removidos os valores dos campos Figura 43 Capitulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas Thursday July 23 2009 Home About Us Search Structural Search Molecular ID Taner DE RS You are searching for CO00500 Number of compounds found 1 Administration Help Contact Us Please Check the information below and change any incorrect incomplete data Structural Data Compound 4 Pentenoic CASRN 62030 45 9
106. sentado um formul rio id ntico ao da inser o dos dados no entanto s o carregados os dados presentes na base de dados relativos ao composto O utilizador poder modific los acrescent los ou apag los e confirmar a actualiza o No desenrolar do projecto surgiram novas funcionalidades e o design da interface foi alterado em v rios aspectos relativamente a estes prot tipos No entanto estes foram uma boa base de partida para estruturar poss veis solu es 3 5 2 Implementa o e Prot tipos de alta fidelidade Ap s termos definido os objectivos os requisitos e as linhas de design do sistema segue se a implementa o dos prot tipos de alta fidelidade Estes prot tipos utilizam as tecnologias do sistema final mas com algumas funcionalidades limitadas 25 e P gina Principal da interface Esta p gina cont m o log tipo e uma pequena apresenta o do ThermInfo Figura 18 As suas funcionalidades encontram se destacadas num menu lateral esquerda em cabe alho e em rodap O esquema da p gina ira manter se para todas as funcionalidades de modo a manter a coer ncia e consequentemente reduzir a carga cognitiva necess ria para lidar com o sistema 34 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Tuesday July 7 2009 Home About Us Search Structural Search Insert Data Help Contact Us IHS
107. strador Figura 38 Diagrama de Colabora o do Caso de Uso Registar uma conta Representa os eventos que o actor utilizador realiza para registar uma conta no sistema descrevendo as entradas e sa das de dados e as mensagens do sistema para cada evento Para inserir novos dados o utilizador ter de se autenticar no sistema atrav s do formul rio apresentado na Figura 39 com os dados que recebeu no seu e mail Log in to ThermInfo Your e mail address and your password are required Note that password is case sensitive You do not have an account Register Here Forgot your password Click Here E mail address Password Security code 7N Type only numerical characters Ignore letters and special characters Figura 39 Formul rio que permite a entrada no sistema para inser o de novos compostos org nicos Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoqu micas A inser o de dados realizada a partir do formul rio apresentado na Figura 40 que disponibiliza diversos campos para as propriedades estruturais e termoqu micas e para as respectivas refer ncias bibliogr ficas descritas no Cap tulo 2 Os campos de preenchimento obrigat rio s o o nome do composto e pelo menos uma refer ncia bibliogr fica Os campos de preenchimento num ricos as entalpias e erros associados o peso molecular e o ano de publica o
108. t http webbook nist gov gt accessed in May 2009 7 Modha J Gwinnett A Bruce M A Review of Information Systems Development Methodology ISDM Selection Techniques Omega 1990 18 473 490 8 Blanchard B S Fabrycky W J Systems engineering and analysis 4th ed Prentice Hall New Jersey 2006 9 Daley R F Daley S J Organic Chemistry Online organic chemistry textbook lt http www ochem4free info gt accessed in May 2009 10 Vollhardt K Schore N Organic Chemistry Structure and Function 4th ed W H Freeman and Company New York 2003 11 Chang R Quimica 8 ed McGraw Hill Lisboa 2005 12 Morrison R T Boyd R N Quimica Org nica 13 ed Funda o Calouste Gulbenkian Lisboa 1996 89 Bibliografia ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 13 McNaught A Wilkinson A Compendium of Chemical Terminology Recommendations TUPAC International Union of Pure and Applied Chemistry Blackwell Science 1997 lt http goldbook iupac org gt accessed in May 2009 14 Weininger D SMILES A Chemical Language and Information System 1 Introduction to Methodology and Encoding Rules J Chem Inf and Comp Sciences 1988 28 31 36 15 Weininger D Weininger A Weininger J L SMILES 2 Algorithm for Generation of Unique SMILES Notation J Chem Inf and Comp Sciences 1989 29 97 101 16 Pedley J B Nayl
109. tetizar os resultados obtidos na fase anterior Seguidamente s o apresentados os requisitos do p blico alvo e do sistema que se pretende desenvolver 22 3 2 1 P blico alvo O p blico alvo do sistema ThermInfo s o essencialmente pessoas com forma o em Qu mica e que trabalham na rea da Energ tica Molecular Assim estamos perante utilizadores altamente qualificados para a an lise destes dados mas pouco especializados em Inform tica e Tecnologias de Informa o tamb m Importante salientar que de uma forma geral estes utilizadores ir o ter pouco tempo dispon vel para uso do sistema Quando questionados acerca da utiliza o de um sistema deste tipo os objectivos esperados s o o acesso r pido e f cil informa o termoqu mica 3 2 2 Sistema Dada a an lise das caracter sticas do p blico alvo na concep o do sistema temos de ter em conta e que os dados devem ser armazenados numa base de dados com arquitectura relacional adequada de forma a que todas as opera es se possam processar de forma r pida eficiente e sem exigir elevados recursos computacionais 23 e a integridade dos dados ou seja garantir que estes devem ser devidamente processados e administrados para evitar incorrec es e 18 Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas incoer ncias que podem prejudicar o trabalho do p blico alvo
110. tica Sistema de Informa o Base de Dados Interface Web Propriedades Termoqu micas Abstract Thermochemical research work often obtains and requires large amounts of data on many kinds of chemical compounds properties It is necessary to organize and make them available in a structured simple and consistent way allowing the cooperation between the scientific community and evolving with time Due the numerous problems derived from applying spreadsheets to this process the proposal of this work was structured the implementation of an Information System to collect and present structural and thermochemical properties of organic compounds In order to fulfill the present needs of storage manipulation and visualization of thermochemical data this project includes four interrelated and complementary phases of development perception problem and requirements analysis design system modeling implementation and system evaluation The information system was named Thermlnjo and it is available at http www therminfo com This system integrates a database based upon a relational data specification to describe structural and thermochemical properties of organic compounds Its user friendly Web interface allows a text based searching compounds insertion and data management Currently Therminfo contains critically evaluated and thermodynamically consistent experimental thermochemical properties values for about 3000 unique and non redundant co
111. tirem rirem e chorarem comigo durante todos estes anos Lisboa 29 de Julho de 2009 Aos meus pais Maria Jos e Jos Alberto pelo amor apoio e compreensao Conte do 1 Introdu o 1 Lila IO MACEAMENO voriaiataninsatcerisisieatienacetiah yeaa sialudaneeaeaceiianieeiee morta es l Ms NTON E O E A AE E aaa T 3 loa ODE IVO EE E tre renee 7 L MCOdOlOS kisia E dadas aaa 8 LS OreaniZacCao dO COCUMENIO ssicsasciied ui dowteleiddes Hucditiied neta LAS 9 2 Conceitos Basicos 11 Zle ASOMPOSTos OTA ANIC O Senra fd 11 2 2 Import ncia do Conhecimento da Energ tica dos Compostos Quimicos15 3 Metodologia e Implementa o 17 Sds Analise do Problema ass us ias wane a AO 17 dado Aainse de RC QUISILOS enn a 18 dude Base de Dados osnan a a 22 So Ardutecura do SEM a aes 29 F MINCED O E RD Dea OE ao nie matasien sana 29 3 3 1 Prototipos de Baixa Pidelid ade saia aos adiada iai guiar doves 29 3 5 2 Implementa o e Prot tipos de Alta Fidelidade 34 33 3 Avalia o de Usabilidade ses iai a ainda deb 60 a a aro AD Ar A A A 61 dl Breca Dido qua dores Aspas ads o aa a a 61 os AJSabtlidade da Interface saia ar ees tuanenida nia naam iow 64 Sere OE E 85 ng E AS 89 1i Lista de Abreviaturas e Siglas ASCII ASTM CAPTCHA CAS CASRN CSS DHTML GOMS HTML ID IP IUPAC JPEG JS KLM KS MySQL Perl PHP SQL SGBD UML USMILES American Standard Code for Information Interchange Ameri
112. titu do pelas propriedades estruturais e termoqu micas de compostos org nicos termodinamicamente consistentes seleccionados de literatura cient fica relevante e descritos no Cap tulo anterior assim como as respectivas refer ncias bibliogr ficas Foi desenvolvido um modelo relacional constitu do por entidades que cont m os atributos que as caracterizam e pelas rela es entre elas Cada linha da entidade tuplo representa uma colec o de dados relacionados O modelo relacional foi escolhido uma vez que tem um bom desempenho e facilidade em realizar consultas aos dados utilizando uma linguagem de alto n vel Structured Language Query SQL f cil de administrar tem ampla aceita o e est muito bem Cap tulo 3 Metodologia e Implementa o 23 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas documentado o que facilita a utiliza o e desenvolvimento de aplica es que trabalhem sobre a base de dados Para al m destes motivos uma abordagem orientada a objectos n o era indicada para a estrutura deste conjunto de dados 23 A Figura 7 mostra o diagrama de classes UML da estrutura da base de dados 23 24 Podemos considerar quatro categorias os dados estruturais os dados termoqu micos as refer ncias bibliogr ficas e os dados dos utilizadores registados subclass name varchar 299 HAS name varchar 255 a class 1 HAS HAS name var
113. tos autor nome da revista titulo do livro ano volume e p gina Esta 10 ndices de colunas http dev mysql com doc refman 5 0 en mysql indexes html Cap tulo 3 Metodologia e Implementa o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas entidade relaciona se com a entidade que descreve os dados termoqu micos data tal como ja foi explicado anteriormente Dentro da categoria dos dados dos utilizadores registados temos uma entidade user que tem 4 atributos nome e mail Institui o e palavra chave O atributo e mail nico de forma a garantir que cada utilizador ter apenas uma conta Cada utilizador poder inserir v rios compostos mas cada composto inserido por um s utilizador Esta rela o entre a entidade molecule e user permite visualizar a contribui o do utilizador com novos dados 3 4 Arquitectura do Sistema A base de dados foi implementada utilizando o SGBD MySQL e foi utilizado o phpMyAdmin para gest o do seu conte do a partir de uma interface Web O phpMyAdmin permite criar remover e alterar bases de dados e tabelas Inserir remover e editar dados executar queries SQL exportar e importar a base de dados entre outros processos administrativos Figura 8 e Figura 9 A base de dados foi carregada com dados recolhidos pelo Grupo de Energ tica Molecular Centro de Qu mica e Bioqu mica e armazenados em folhas de c lculo Para importar estes
114. unt on ThermInfo Structural Search On this page you can register an account for inserting new compounds on Therminfo Your name e mail address and Institution are required Afterwards you have to wait for approval by an adminstrator when that happens Insert Data you will receive an e mail containing the password to Login Thus if you fail to provide your e mail address you will not be able to use this service MN Administration Contact Us Name E mail address Institution 5E7K49 Security code Type only numerical characters Ignore letters and special characters Figura 37 Formul rio de registo no sistema ThermlInfo Cap tulo 3 Metodologia e Implementa o 48 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Ver fica a validade dos dados do utilizador gt Envia o nome do utilizador Envia o e mail do utilizador 4 Envia a institui o do utilizador CR 1 Registar uma conta A Utilizador n o registado Formul rio Registo de Verifica dados do utilizador uma conta Espera pela recep o de um e mail de valida o da conta e palavra chave 6 O sistema envia um e mail ao administrador amp Verifica os dados para entrar no sistema E mail com os dados Mensagem de sucesso de acesso do registo da conta T Aceita o novo utilizador que adicionado base de dados Verifica dados do utilizador Admini
115. ver a m o para o teclado H 8 Prepara o Mental M 9 Digitar o nome do composto methylene 9K 10 Mover a m o para o rato H 11 Prepara o Mental M 12 Mover o cursor at caixa da escolha do tipo de intervalo para o peso molecular P 13 Clicar no tipo de intervalo pretendido gt B 14 Prepara o Mental M 15 Mover o cursor at caixa do peso molecular P 16 Mover a m o para o teclado H 17 Prepara o Mental M 18 Digitar o peso molecular 30 2K 19 Mover a m o para o rato H 20 Prepara o Mental M 21 Mover o cursor at caixa da escolha do estado f sico P 22 Clicar no estado f sico pretendido crystal B 23 Prepara o Mental M 24 Mover o cursor at checkbox correspondente caracter stica polymer P 25 Clicar na checkbox B 26 Prepara o Mental M 27 Mover o cursor at caixa do c digo de seguran a P 28 Clicar na caixa do c digo de seguran a B 29 Mover a m o para o teclado H 30 Prepara o Mental M 31 Digitar o c digo de seguran a 6K 32 Mover a m o para o rato H 33 Prepara o Mental M 34 Mover o cursor at ao bot o Search P 35 Clicar no bot o Search B 36 Resposta do sistema R 37 Prepara o Mental M Cap tulo 4 Avalia o 71 ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas 38 M
116. za o das tarefas 74 Capitulo 4 Avalia o ThermInfo Sistema de Informa o para Coligir e Apresentar Propriedades Termoquimicas Foi recolhida a opini o dos utilizadores com base em coment rios ao longo da utiliza o da interface e posteriormente num question rio Este question rio centrou se em tr s quest es categ ricas subjectivas de escala entre 0 e 5 1 Como classifica a facilidade tempo de aprendizagem necess rio 2 Como classifica a facilidade em memorizar a forma como a tarefa executada 3 Como classifica a sua satisfa o em utilizar esta interface Este teste de avalia o de usabilidade foi realizado para um total de 43 participantes dos quais 18 eram profissionais da rea da Qu mica e 25 tinham elevados conhecimentos e experi ncia na utiliza o das Tecnologias de Informa o Os resultados dos testes de usabilidade e question rios encontram se resumidos na Tabela 4 em termos de m dia e desvio padr o para cada uma das tarefas e para cada um dos grupos Toda a an lise estat stica foi realizada utilizando o SPSS 16 0 ANEXO I Tabela de dados utilizada para realizar a avalia o de usabilidade Tabela 4 Resultados dos testes de usabilidade para todos os participantes e para cada um dos grupos em 65 8 66 6 64 8 espec fico Es N Tarefa 1 All 43 9 3 1 I 25 2 3 1 Q 18 2 3 M dia do tempo segundos 68 3 64 8 68 0 64 4

Download Pdf Manuals

image

Related Search

Related Contents

User's Manual    FUNAI LC200EM8 Flat Panel Television User Manual  Olympus UltraZoom SP-500 User's Manual  PCIE2-437 USER`S MANUAL  取扱説明書  Guide des formations      Draytek Vigor 2900V  

Copyright © All rights reserved.
Failed to retrieve file