IA lê artigos científicos antigos e faz descobertas que os humanos não viram

Comentar

Pesquisadores do Berkeley Lab descobriram que a extração de textos de resumos de ciência de materiais poderia revelar novos materiais termoe...

Pesquisadores do Berkeley Lab descobriram que a extração de textos de resumos de ciência de materiais poderia revelar novos materiais termoelétricos. Sistema baseado em tecnologia desenvolvida pela Google permite a captura de conceitos relacionados à ciência de materiais, como a estrutura da tabela periódica, e descobertas científicas que passaram despercebidas dos cientistas.

A maior parte do conhecimento científico é publicada como texto, tornando difícil sua avaliação tanto pela análise estatística tradicional quanto pelos modernos métodos de aprendizado de máquina. Com essas premissas em mente, pesquisadores do Lawrence Berkeley National Laboratory usaram o algoritmo denominado Word2vec (desenvolvido pelo Google e que possui uma versão open source) para tentar fazer emergir conexões que os humanos não perceberam. O algoritmo então fez previsões sobre possíveis materiais termoelétricos, que convertem calor em energia e são usados para muitas aplicações de aquecimento e resfriamento.

Segundo os pesquisadores, foi mostrado que o conhecimento da ciência dos materiais presente na literatura publicada pode ser eficientemente codificado como incorporação de palavras densas em informação, isto é, representações vetoriais de palavras, sem supervisão humana.

O trabalho publicado no periódico Nature, em 3 de julho, mostrou que sem qualquer inserção explícita do conhecimento químico, essas incorporações capturaram conceitos complexos de ciência de materiais, como a estrutura da tabela periódica e as relações entre os materiais.

Além disso, foi demonstrado que um método não supervisionado poderia recomendar materiais para aplicações funcionais vários anos antes de sua descoberta sugerindo que o conhecimento latente sobre descobertas futuras está, em grande parte, embutido em publicações anteriores.

A tabela periódica de Mendeleiev está à direita. A representação dos elementos do Word2vec, projetada em duas dimensões, está à esquerda. (Crédito: Berkeley Lab)

Para tanto, uma equipe de cientistas da Divisão de Armazenamento de Energia e Recursos Distribuídos do Berkeley Lab, coletou 3,3 milhões de resumos de publicações científicas sobre materiais e alimentou o Word2vec. Ao analisar as relações entre as palavras, o algoritmo foi capaz de prever antecipadamente descobertas de novos materiais termelétricos e sugerir materiais ainda desconhecidos como candidatos a materiais termoelétricos.

“Sem dizer nada sobre ciência dos materiais, aprendeu conceitos como a tabela periódica e a estrutura cristalina dos metais. Isso sugeriu o potencial da técnica. Mas provavelmente a coisa mais interessante que descobrimos é que você pode usar esse algoritmo para resolver lacunas na pesquisa de materiais, coisas que as pessoas deveriam estudar, mas ainda não estudaram até agora ”.

A equipe reuniu os resumos de artigos publicados em mais de 1.000 periódicos entre 1922 e 2018. O Word2vec pegou cada uma das cerca de 500.000 palavras distintas nesses resumos e transformou cada uma em um vetor de 200 dimensões, ou uma matriz de 200 números.

Depois de treinado, esse algoritmo possibilita ver como as palavras se relacionam umas com as outras permitindo inclusive, fazer cálculos comuns com vetores. Por exemplo, conforme outros pesquisadores mostraram treinando o Word2vec a partir de fontes de textos não científicos e pegar o resultado da operação "Rei - Rainha" você obteria o mesmo resultado que "Homem - Mulher".

Da forma análoga, quando treinado com textos da ciência dos materiais, o algoritmo foi capaz de aprender o significado de termos e conceitos científicos, como a estrutura cristalina dos metais, baseada simplesmente nas posições das palavras nos resumos e sua co-ocorrência com outras palavras. Por exemplo, poderia descobrir que, para a equação "ferromagnético - NiFe + IrMn", a resposta seria "antiferromagnética".

A equipe do Berkeley Lab então pegou os principais candidatos termoelétricos sugeridos pelo algoritmo, que classificou cada composto pela semelhança de seu vetor de palavras com o da palavra "termoelétrico". Depois, eles executaram cálculos para verificar as previsões do algoritmo.

Das 10 principais previsões, eles descobriram que todos computaram fatores de potência um pouco acima da média das termoelétricas conhecidas; os três principais candidatos apresentavam fatores de potência acima do percentil 95 das termoelétricas conhecidas.

Em seguida, eles testaram se o algoritmo poderia realizar experimentos “no passado”, dando-lhe resumos apenas até, digamos, o ano 2000. Novamente, das previsões mais altas, um número significativo apareceu em estudos posteriores - quatro vezes mais do que se os materiais tinha acabado de ser escolhido aleatoriamente. Por exemplo, três das cinco principais previsões treinadas usando dados até o ano de 2008 foram descobertas e as duas restantes continha elementos raros ou tóxicos.

Um desses componentes, CuGaTe2, representa um dos melhores termoelétricos dos dias atuais e teria sido previsto como um dos 5 melhores componentes quatro anos antes de sua publicação em 2012. - Trecho do artigo

Os resultados foram surpreendentes.

“Honestamente, eu não esperava que o algoritmo fosse tão preditivo de resultados futuros. Eu achava que talvez o algoritmo pudesse descrever o que as pessoas haviam feito antes, mas não ter essas conexões diferentes. Fiquei bastante surpreso quando vi não apenas as previsões, mas também o raciocínio por trás das previsões, coisas como a estrutura da metade de Heusler, que é uma estrutura de cristal realmente quente para termoelétricas nos dias de hoje”  - Anubhav Jain

Ele acrescentou: "Este estudo mostra que, se este algoritmo estivesse em vigor anteriormente, alguns materiais poderiam ter sido descobertos com anos de antecedência". Juntamente com o estudo, os pesquisadores estão lançando os 50 principais materiais termoelétricos previstos pelo algoritmo.

Jain disse que a equipe está trabalhando em um mecanismo de busca mais inteligente e poderoso, permitindo que pesquisadores pesquisem resumos de uma maneira mais útil.

O estudo foi financiado pelo Toyota Research Institute. Outros co-autores do estudo são John Dagdelen, pesquisadores de Berkeley Lab, Leigh Weston, Alexander Dunn e Ziqin Rong, e a pesquisadora da UC Berkeley, Olga Kononova.

Fonte: Nature
[Visto no Brasil Acadêmico]

COMMENTS

BLOGGER

$show=mobile

Nome

#existepesquisanobrasil,1,A divulgar,2,Abelha,3,Acessibilidade,20,acessório,2,Acidente,48,Acidentes,2,Acústica,16,Adágios,1,Adestramento,5,Administração,27,adulto,1,Aerodinâmica,4,Aeronáutica,8,África,6,Agência Brasil,19,Agência Fiocruz,1,Agência Porvir,1,Agência Senado,1,Agência USP,4,Agricultura,4,Agropecuária,3,AIDS,1,AirBNB,1,Alcoolismo,7,Alemanha,3,Alerta,1,Algoritmo,8,Alimento,1,Alzheimer,4,Amazon,2,Amazônia,4,América Latina,1,Análise Combinatória,1,Anatomia,7,Android,3,Animação,47,Animais de Estimação,6,Animal,2,Antropologia,14,Apicultura,8,App,9,Apple,5,Apresentação,4,aquário,1,Argentina,4,Arqueologia,5,arquitetura,29,Arte,152,Astrobiologia,2,Astrofísica,3,Astronomia,25,Ativismo,26,Áudio,3,Audio FX,2,Áustria,1,Autismo,2,Auto-ajuda,10,Automobilismo,14,Automóvel,19,aventura,3,Aviação,5,Aviônica,8,Bahia,2,Balonismo,3,Banco Central,1,Banco de Dados,5,Beber e Dirigir,1,biblioteconomia,3,Bicicleta,1,Biografia,16,Biologia,157,Biologia Marinha,15,bioquímica,6,Biotecnologia,25,Bitcoin,2,Blog,29,Blogger,32,Boato,5,Bomba,1,borderô de desconto,1,Botânica,5,BRASA,1,BRASA Leads,1,Brasil,34,Brasília,14,BRIC,1,Browser,10,Bugs,3,CAD,3,Calor,2,Câmera lenta,1,Campanha,44,cardiologia,15,Carnaval,2,carreira,2,Cartografia,3,Casemods,1,Caso Isabella Nardoni,1,Caso Snowden,1,Ceará,1,Celebridades,6,celular,24,Células-Tronco,3,Cérebro,2,Charge,22,China,16,Cibercultura,2,Ciclovia,1,Cidadania,39,Ciência,183,Cinema,63,Clip,1,Cliparts,1,Cloud computing,4,Coaching,12,Comédia,2,competência,1,Complemento de dois,1,Comportamento,252,Computação,81,Computação em grade,5,Computação forense,3,Computação Gráfica,135,Computação Móvel,1,Computação Quântica,1,Comunicação e Marketing,131,Concurso,1,Concurso Cultural de Natal,1,Concursos Público,2,Concursos Públicos,4,Conectômica,1,Conferência,1,Congresso em Foco,1,Conspiração,2,Consumidor,7,Consumismo,3,contabilidade,2,Contos,48,Copa do Mundo,27,Cordel,3,Coreia do Norte,1,Coreia do Sul,1,Corpo,2,Coruja,1,cosmética,3,Cosmologia,21,Crash Course,1,Criança,1,Criatividade,3,Crime,47,Crime Digital,7,crise,11,crise econômica,8,crônica,5,crônicas,5,Cronologia,1,CSS,3,Cuba,4,Culinária,8,Cultura,9,Curiosidades,112,custos fixo,1,custos variáveis,1,Dança,6,DAO,1,Darwin,9,Davos,1,Debate,1,Decoração,1,demência,1,Demografia,3,Denúncia,10,Dermatologia,7,Desastre Natural,13,Descoberta,2,desconto duplicatas,1,Desenho instrucional,11,Desenvolvimento de jogos,9,Design,25,Design Instrucional,6,Destaque,25,Dia das Mães,1,Dia do professor,1,diabetes,6,Dicas,66,Didática,1,Dieta,3,diplomacia,3,Direito,176,Direito Eleitoral,1,Direito Internacional,28,Direito Militar,1,Direito Trabalhista,1,Direito Tributário,2,Direitos Autorais,1,Direitos Humanos,37,Disney,5,Distrito Federal,2,Documentário,60,Doutorado,1,download,3,Drogas,7,Drone,3,Dubai,1,e-Book,2,e-governo,2,EBC,1,Ecologia,81,Economia,107,Editoração Eletrônica,1,Educação,335,Educação a Distância,147,Educação Corporativa,4,educação física,19,Educação sexual,6,Efeitos Sonoros,4,Egiptologia,1,Eleições,23,Eleições 2014,12,Eleições 2018,5,Eletricidade,9,eletrônica,3,Em Operários,1,Embrapa,1,empreendedorismo,6,enciclopédia,1,endocrinologia,5,Enem,3,Energia,14,Energia Alternativa,16,Energia Nuclear,11,Engenharia,62,Engenharia Agrícola,1,Engenharia Civil,4,Engenharia de materiais,15,Engenharia de Software,4,Engenharia Genética,30,Engenharia Mecânica,1,Enretenimento,1,Ensino a Distância,9,Ensino Superior,3,Entomologia,7,Entretenimento,41,Entrevista,87,Entrevista.,1,Epidemiologia,21,Epistemologia,1,Equador,1,Escândalo,5,Escritório,1,Espaço,66,Espanha,1,Espanhol,2,Espeleologia,1,Espetáculo,8,Espionagem,20,Esporte,39,Estação,1,Estágio,2,Estatísticas,32,estrutura de dados,1,Ética,24,EUA,14,Europa,2,Evento,37,Evolução,4,Exercícios físicos,2,Exobiologia,2,experiência,42,fábulas,3,Facebook,17,Farmacologia,9,Favo,1,Feminismo,1,Férias,1,Ferramentas,6,FIFA,2,Filantropia,4,Filmes,16,Filosofia,47,Finlândia,1,Fintech,1,Firefox,1,Física,104,Física Quântica,3,Fisiologia,7,Fisioterapia,6,Flagrante,2,Flamengo,1,Folclore,3,Fome,1,Fonética,1,Fonoaudiologia,6,Fotografia,40,Fotos em 360 graus,6,França,6,Francês,2,frases,2,Fraude,5,Freeware,68,Futebol,38,Futurologia,81,gadget,88,Gafe,2,Gamificação,5,Gastroenterologia,5,Gastronomia,2,Geek,1,Genética,39,Geofísica,1,Geografia,52,Geologia,10,Geometria,6,geopolítica,20,Gerenciamento do Tempo,1,Geriatria,10,Gestão de Competências,2,Gestão de Configuração,2,Gestão de Pessoas,3,Gestão de Projetos,17,Gestão do conhecimento,6,Ginecologia,3,Glass,1,Google,79,Governo,4,GPS,1,Gradiente,1,gramática,13,Gravidez,1,Grécia,1,Grécia Antiga,1,Guerra,36,Guerra Civil,2,Guinness,1,H2,2,Haiti,3,hardware,35,História,195,HIV,1,Hololens,2,homenagem,45,Horologia,1,HPV,1,HTML,6,Humor,209,Humor Negro,8,IBGE,2,IBM,4,ICIJ,2,Idioma,46,IHC,8,ilo,29,ilusão,34,ilusionismo,5,Imagem 3D,16,Imagens,6,Imagine Cup,1,Império Romano,6,Imprensa,33,Impressora 3D,17,Imunologia,2,Incêndio,2,Inclusão digital,8,Índia,3,Índios,1,Infectologia,16,Infográfico,48,Informática,38,Inglaterra,3,Inglês,25,Inovação,181,Inspiração,1,Inteligência Artificial,100,intercâmbio,1,Interface,190,Interfaces Hápticas,20,Internacional,22,Internacionalização da Amazônia,3,Internet,160,Internet das Coisas,2,Inundação,2,Invenção,20,Inventos,6,iPad,1,IPEA,1,iphone,3,Irã,3,Iraque,1,Israel,6,Japão,2,Java,2,Java.,2,jogos,10,Jogos educativos,13,Jogos Olímpicos,10,Jornalismo,69,Justiça,4,Kinect,10,Le Monde Diplomatique Brasil,9,Le Monde Diplomatique Brasil,1,Letras,1,Lexicografia,5,Liderança,3,Life Hacking,20,Linguística,9,Literatura,55,Livro,59,Lógica,25,Logística,4,Loterias,4,Lua,1,Maçonaria,4,Malásia,2,Malvinas,2,Malware,1,Mapa,69,Mário Sérgio Conti,1,Marte,2,Mastologia,1,Matemática,76,Matemática Financeira,1,maternidade,1,Mecânica,8,Mecânica dos Fluidos,2,Mecatrônica,46,Medicina,475,Medicina Esportiva,1,Medicina Veterinária,4,Meio Ambiente,104,Mel,1,melanoma,1,Memória,5,memorização,4,Mente,4,Mercado de Trabalho,71,mercosul,1,Mestrado,1,meteorologia,11,Metodologia Científica,44,México,1,Microbiologia,4,Microsoft,14,Mídia Social,54,Militar,14,Mineralogia,1,Mistério,2,MIT,13,Mitologia,2,Mobilidade,1,Mobilidade Urbana,9,MonaVie,1,Montanhismo,1,Moodle,7,Mossad,1,Motivação,1,Movimento Maker,1,MSF,1,Mudança Climática,20,Mulher,4,Multimídia,14,museu,10,Música,83,MVC,1,Nanotecnologia,34,Nasa,16,Natação,2,Natal,17,Natureza,1,Negócios,25,Netflix,1,Neurociência,84,Neurologia,77,Nicolelis,1,Nordeste,2,Noruega,1,notícias,8,Novidades,18,Novo Enem,2,Números,1,Nutrição,63,Obama,1,Obesidade,10,Observatório da Imprensa,26,Obstetrícia,3,Oceanografia,7,odontologia,7,Offshore Leaks,2,oftalmologia,11,Olimpíadas,7,oncologia,45,ONU,8,Opinião,92,Óptica,17,Oracle,1,Oriente Médio,5,Orkut,2,Ornitologia,1,ortografia,3,Ortopedia,3,Ótica,8,Otorrinolaringologia,1,Oxfam,2,Pacifismo,1,Paginadores,1,paleontologia,3,Paquistão,1,Pará,2,Paraguai,2,parkinson,2,Passeio virtual,1,Patinação,1,Pedagogia,1,Pediatria,6,Pensamentos,2,performance,2,Periférico,1,Pesca,2,Pesquisa,199,Petição,1,Petrobrás,9,Petróleo,12,Photoshop,5,Pirataria,7,planilha de custo,1,Playstation 3,2,Plebiscito,3,Pneumologia,1,Podcast,4,Poesia,28,Poítica,1,Politica,5,Política,289,Portugal,6,português,18,Pós-graduação,1,prazo médio,1,Pré-sal,5,Prêmio Nobel,6,primatologia,1,Primeira Guerra Mundial,1,privacidade,18,produtividade,3,professor Hamilton Alves,2,Programa Gratuito,4,Programação,51,Projeção Mapeada,1,Projeto Truco,2,Promoção,1,Propaganda,5,Psicanálise,1,Psicologia,267,Psicologia Animal,24,Psiquiatria,13,Pública,12,publicidade,19,Publieditorial,4,Quadrinhos,10,Quads,5,Qualidade,3,Qualidade de Vida,11,química,32,REA,2,realidade aumentada,44,realidade diminuída,2,Realidade Misturada,2,Realidade Virtual,38,Reconhecimento de imagem,12,Reconhecimento de voz,3,Recorde,1,Recoverit,1,Recuperar vídeos,1,Redação,1,redes,10,Referência,2,Referendo,1,Reforma Política,3,Reino Unido,1,Relacionamento,2,Relações Internacionais,40,Religião,39,Responsabilidade Social,4,Retrospectiva,1,Review,4,Rio 2016,6,Rio de Janeiro,1,Rio Grande do Norte,1,Rio Grande do Sul,1,robótica,97,Roda Viva,47,Roma,5,roteiro,1,RSA,1,Rússia,1,Samsung,1,Sanitarismo,5,Santa Catarina,1,São Paulo,4,Saúde,492,Savant,1,Segunda Guerra Mundial,23,Segurança,117,Segurança da Informação,60,Seleção Natural,2,Séries,2,serviço,1,Serviço Online,1,Sexologia,2,sexualidade,5,Show,7,SIGGRAPH,1,Simulação,29,Singularity University,1,Síria,3,Sismologia,2,Sistema operacional,4,Sistemas de Numeração,1,Sites de Busca,14,Sociedade,4,Sociologia,52,Software,32,Software Livre,25,Sol,2,Sono,4,Sony,2,SOPA,2,Star Wars,1,Suécia,3,Sugestão de presentes,62,Sun,1,supercomputadores,2,Sustentabilidade,5,Tabagismo,6,Taiwan,1,Talento precoce,1,taxa de juros efetiva,1,taxa de juros nominal,1,Taxas Equivalentes,1,Taxidermia,1,Teatro,26,Técnicas de Estudo,2,Tecnologia,543,Tecnologia da Informação,28,TED,394,TED-Ed,42,TedMed,2,TEDx,1,TEDx Rio+20,1,TEDxAmazônia,1,TEDxAsaSul,1,Telefonia,59,Televisão,43,Temas,1,Tempo,1,Tendências,10,Teologia,5,teoria das supercordas,1,Teoria dos Jogos,1,Terremoto,7,Terrorismo,15,Tesla,1,Testes,17,Tipologia,8,Tomada de Decisão,1,tradução,5,Trânsito,11,transporte,55,tributo,3,Trigonometria,1,Tubarão,2,Tunísia,1,Turismo,21,Tutorial,20,Twitter,8,Uber,4,UFC,1,UFG,1,ufologia,5,UFRJ,1,Unicamp,1,UNIFESP,1,universidade,5,Universidade Corporativa,1,Universidade de Cambridge,2,Universidade de Michigan,1,Universidade de Princeton,1,Universidade de Rochester,1,Urbanismo,23,Urologia,1,User Experience,1,USP,6,Utilidade Pública,3,Utilitário,3,Vale,1,Vaticano,1,Veículo Autônomo,7,Ventriloquismo,3,Verão,1,vestibular,3,Vestimenta,1,Vida Digital,7,Vida Moderna,18,Vida Selvagem,10,Videogame,114,Vídeos,938,Vídeos 360,1,Violência,5,Vírus,2,Visão Computacional,9,Vôlei,1,Vulcanologia,6,Watergate Política,1,WCIT 2016,2,WCIT 2017,1,Web 2.0,29,Web Application,137,Web Semântica,2,Web Seminar,1,webdesign,11,Webinar,2,widget,2,WikiLeaks,37,Wikipedia,4,Windows,5,Xadrez,2,YouTube,6,Zika,1,Zoologia,56,
ltr
item
Brasil Acadêmico: IA lê artigos científicos antigos e faz descobertas que os humanos não viram
IA lê artigos científicos antigos e faz descobertas que os humanos não viram
https://1.bp.blogspot.com/-6cwx7o_a4uk/XS5f3rj1f6I/AAAAAAAA9xw/ApFYKAjrirUaUfJegQ7Hy_q2i4av6W0jwCLcBGAs/s320/word2vec.jpg
https://1.bp.blogspot.com/-6cwx7o_a4uk/XS5f3rj1f6I/AAAAAAAA9xw/ApFYKAjrirUaUfJegQ7Hy_q2i4av6W0jwCLcBGAs/s72-c/word2vec.jpg
Brasil Acadêmico
https://blog.brasilacademico.com/2019/07/ia-le-artigos-cientificos-antigos-e-faz.html
https://blog.brasilacademico.com/
http://blog.brasilacademico.com/
http://blog.brasilacademico.com/2019/07/ia-le-artigos-cientificos-antigos-e-faz.html
true
3049085869098582068
UTF-8
Todos os posts carregados Nenhumpost encontrado VER TODOS Leia mais Responder Cancelar resposta Deletar Por Home Páginas POSTS Ver Todos Recomendado para você CATEGORIA ARQUIVO BUSCA TODOS POSTS Não encontrado nehum post de acordo com o seu critério Voltar para Home Sunday Monday Tuesday Wednesday Thursday Friday Saturday Sun Mon Tue Wed Thu Fri Sat January February March April May June July August September October November December Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez agorinha 1 minuto atrás $$1$$ minutos atrás 1 hora atrás $$1$$ horas atrás Ontem $$1$$ dias atrás $$1$$ semanas atrás mais que 5 semanas atrás Seguidores Seguir THIS PREMIUM CONTENT IS LOCKED STEP 1: Share to a social network STEP 2: Click the link on your social network Copy All Code Select All Code All codes were copied to your clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy