$hide=/p/valores.html

Google ensina formiga a jogar bola

Indicar:

Novo algoritmo de IA bate quase todo mundo nos antigos jogos do ATARI e agora começa a se aventurar em ambientes 3D.

Novo algoritmo de IA bate quase todo mundo nos antigos jogos do ATARI e agora começa a se aventurar em ambientes 3D.

Talvez a Alphabet devesse ter consultado uma Inteligência Artificial antes de investir 400 milhões de dólares na empresa DeepMind, em 2014, e pouco mais de dois anos depois só ter conseguido um bot melhor para demonstrar como se joga River Raid.
Desempenho do DQN e da aprendizagem linear nos 50 jogos do Atari testados.
Evidentemente, estou brincando. De fato, até uma visão computacional consegue enxergar, na semente, que esse é um grande passo para a humanidade ser solapada pela Skynet. Pelo menos no que se refere aos e-sports.

E falando em jogos, há décadas já jogaram na nossa cara que os computadores jogam xadrez melhor que os humanos. Todavia, o computador usado para derrotar o grande campeão mundial, Gary Kasparov, na célebre série de jogos que evidenciou o avançado estágio evolutivo da IA, em 1997, era assessorado por um time de programadores e mestres do xadrez.

Mas há algo de novo na estratégia usada pela DeepMind. Na abordagem denominada Deep Q-network (DQN), descrito em um artigo publicado na Nature, eles dão pouca assistência para o aprendizado da máquina. Dessa forma, o computador parece mais um calouro submetido a um se-vira-nos-30 do que a um cantor pop pedindo 200 toalhas para a produção antes de um espetáculo.

Nessa abordagem, a aprendizagem por reforço ganha mais desempenho conseguindo dessa forma que os agentes virtuais (o bot jogador) tenha um aprendizado mais parecido com o humano - sem conhecimento prévio das regras dos jogos e sendo estimulado pelas pontuações e dando comandos aleatórios no controle - com os pesquisadores chegando ao ponto de comparar o algoritmo com o sistema de recompensa da dopamina no cérebro, através da tentativa e erro e com a recompensa reforçando o aprendizado.

Há alguma evidência de que os humanos tem um sistema similar de aprendizagem por reforço na área de dopamina do cérebro. Esse foi uma das motivações para fazermos nosso trabalho pois os humanos também aprendem por tentativa e erro similarmente - por observar recompensa e aprender reforçando aquelas recompensas.
David Silver. Um dos desenvolvedores do sistema


Clique     Retroceder    Avançar   Espaço /    /   F



Por exemplo, no vídeo acima, o agente DQN aperfeiçoa sua técnica jogando breakout. Aprendendo com seu erros até entender que atirar a bolinha no túnel formado nos cantos é a estratégia "matadora" onde ele consegue os melhores resultados. E ele consegue aprender isso jogando apenas 600 vezes.

  • [message]
    • Nota
      • A pontuação é exibida no alto à esquerda da tela (com um máximo de 488 pontos ao limpar os blocos), o número de vidas remanescentes fica no meio (iniciando-se com 5 vidas) , e o número “1” no alto à direita indica que o modo do jogo é para 1 jogador apenas.


Clique     Retroceder    Avançar   Espaço /    /   F



Mas o mundo do Atari é limitado demais para as ambições alphabetianas. Para explorar o potencial da IA em um ambiente tridimensional o Google Deep Mind lançou recentemente a suíte de navegação 3D e ambiente de resolução de problemas denominado Labyrinth. Mas ao contrário do DQN, que é de código livre (desenvolvido na linguagem brasileira Lua) podendo ser conectado ao emulador de Atari 2600 gratuito (donationware) Stella, suas soluções para o ambiente 3D ainda não foram abertas para o público.

Clique     Retroceder    Avançar   Espaço /    /   F



A seguir, veja como o agente DQN (representado por uma formiga digital de 4 pernas) consegue chutar a bola para a meta (em vermelho).

Clique     Retroceder    Avançar   Espaço /    /   F



Pode parecer apenas um vídeo trivial, mas mostra um teste importante para a eficácia processo de aprendizagem por recompensa assíncrono. A IA não apenas aprende como mover a tal formiga sem nenhuma heurística prévia de como isso deve ser coordenado, mas também tem que saber como chutar a bola no gol. É como se você aprendesse a andar ao mesmo tempo que jogasse sua primeira partida de futebol.

Segundo o Engadget, apesar do Google não explicar em profundidade qual é o real significado dessa tecnologia. Sua rápida menção ao algoritmo nos dá uma ideia de que a técnica poderia ajudar a "manipulação robótica". Um membro de um robô poderia começar a andar (sem ser programado previamente para isso) ou aprender a pegar todo tipo de objeto que nunca tenha visto antes.

Fonte: YouTube, Google Deep Mind
[Visto no Brasil Acadêmico]

Comentários

BLOGGER

$hide=/p/valores.html

[/fa fa-cloud/ Nuvem de categorias]$hide=mobile

Nome

A divulgar Abelha Acessibilidade acessório Acidente Acidentes Acústica Adágios Adestramento Administração adulto Aerodinâmica Aeronáutica África Agência Brasil Agência Fiocruz Agência Porvir Agência Senado Agência USP Agricultura Agropecuária AIDS Alcoolismo Alemanha Alerta Algoritmo Alimento Alzheimer Amazon Amazônia América Latina Análise Combinatória Anatomia Android Animação Animais de Estimação Animal Antropologia Apicultura App Apple Apresentação aquário Argentina Arqueologia arquitetura Arte Astrobiologia Astrofísica Astronomia Ativismo Áudio Audio FX Áustria Autismo Auto-ajuda Automobilismo Automóvel aventura Aviação Aviônica Bahia Balonismo Banco de Dados Beber e Dirigir biblioteconomia Bicicleta Biografia Biologia Biologia Marinha bioquímica Biotecnologia Bitcoin Blog Blogger Boato Bomba borderô de desconto Botânica BRASA Leads Brasil Brasília BRIC Browser Bugs CAD Calor Câmera lenta Campanha cardiologia Carnaval carreira Cartografia Casemods Caso Isabella Nardoni Caso Snowden Ceará Celebridades celular Células-Tronco Cérebro Charge China Cibercultura Ciclovia Cidadania Ciência Cinema Clip Cliparts Cloud computing Coaching Comédia competência Complemento de dois Comportamento Computação Computação em grade Computação forense Computação Gráfica Computação Móvel Comunicação e Marketing Concurso Concurso Cultural de Natal Concursos Público Concursos Públicos Conectômica Conferência Congresso em Foco Conspiração Consumidor Consumismo contabilidade Contos Copa do Mundo Cordel Coreia do Norte Coreia do Sul Corpo Coruja cosmética Cosmologia Crash Course Criança Criatividade Crime Crime Digital crise crise econômica crônica crônicas Cronologia CSS Cuba Culinária Cultura Curiosidades custos fixo custos variáveis Dança DAO Darwin Davos Debate Decoração demência Demografia Denúncia Dermatologia Desastre Natural Descoberta desconto duplicatas Desenho instrucional Desenvolvimento de jogos Design Design Instrucional Destaque Dia das Mães Dia do professor diabetes Dicas Didática Dieta diplomacia Direito Direito Eleitoral Direito Internacional Direito Tributário Direitos Humanos Disney Distrito Federal Documentário Doutorado download Drogas Drone Dubai e-Book e-governo EBC Ecologia Economia Editoração Eletrônica Educação Educação a Distância Educação Corporativa educação física Educação sexual Efeitos Sonoros Egiptologia Eleições Eleições 2014 Eleições 2018 Eletricidade eletrônica Embrapa empreendedorismo enciclopédia endocrinologia Enem Energia Energia Alternativa Energia Nuclear Engenharia Engenharia Agrícola Engenharia Civil Engenharia de materiais Engenharia de Software Engenharia Genética Engenharia Mecânica Enretenimento Ensino a Distância Ensino Superior Entomologia Entretenimento Entrevista Entrevista. Epidemiologia Epistemologia Equador Escândalo Escritório Espaço Espanha Espanhol Espeleologia Espetáculo Espionagem Esporte Estação Estágio Estatísticas estrutura de dados Ética EUA Europa Evento Evolução Exercícios físicos Exobiologia experiência fábulas Facebook Farmacologia Favo Feminismo Férias Ferramentas FIFA Filantropia Filmes Filosofia Finlândia Firefox Física Física Quântica Fisiologia Fisioterapia Flagrante Flamengo Folclore Fome Fonética Fonoaudiologia Fotografia Fotos em 360 graus França Francês frases Fraude Freeware Futebol Futurologia gadget Gafe Gastroenterologia Gastronomia Geek Genética Geofísica Geografia Geologia Geometria geopolítica Gerenciamento do Tempo Geriatria Gestão de Competências Gestão de Configuração Gestão de Pessoas Gestão de Projetos Gestão do conhecimento Ginecologia Glass Google Governo GPS Gradiente gramática Gravidez Grécia Grécia Antiga Guerra Guerra Civil Guinness H2 Haiti hardware História HIV Hololens homenagem Horologia HPV HTML Humor Humor Negro IBGE IBM ICIJ Idioma IHC ilo ilusão ilusionismo Imagem 3D Imagens Imagine Cup Império Romano Imprensa Impressora 3D Imunologia Incêndio Inclusão digital Índia Índios Infectologia Infográfico Informática Inglaterra Inglês Inovação Inspiração Inteligência Artificial intercâmbio Interface Interfaces Hápticas Internacional Internacionalização da Amazônia Internet Internet das Coisas Inundação Invenção Inventos iPad IPEA iphone Irã Iraque Israel Japão Java Java. jogos Jogos educativos Jogos Olímpicos Jornalismo Justiça Kinect Le Monde Diplomatique Brasil Le Monde Diplomatique Brasil Letras Lexicografia Liderança Life Hacking Linguística Literatura Livro Lógica Logística Loterias Lua Maçonaria Malásia Malvinas Malware Mapa Mário Sérgio Conti Marte Mastologia Matemática Matemática Financeira maternidade Mecânica Mecânica dos Fluidos Mecatrônica Medicina Medicina Esportiva Medicina Veterinária Meio Ambiente Mel melanoma Memória memorização Mente Mercado de Trabalho mercosul Mestrado meteorologia Metodologia Científica México Microbiologia Microsoft Mídia Social Militar Mineralogia Mistério MIT Mitologia Mobilidade Mobilidade Urbana MonaVie Montanhismo Moodle Mossad Motivação Movimento Maker MSF Mudança Climática Mulher Multimídia museu Música MVC Nanotecnologia Nasa Natação Natal Natureza Negócios Netflix Neurociência Neurologia Nicolelis Nordeste Noruega notícias Novidades Novo Enem Números Nutrição Obama Obesidade Observatório da Imprensa Obstetrícia Oceanografia odontologia Offshore Leaks oftalmologia Olimpíadas oncologia ONU Opinião Óptica Oracle Oriente Médio Orkut Ornitologia ortografia Ortopedia Ótica Otorrinolaringologia Oxfam Pacifismo Paginadores paleontologia Paquistão Pará Paraguai parkinson Passeio virtual Patinação Pedagogia Pediatria Pensamentos performance Periférico Pesca Pesquisa Petição Petrobrás Petróleo Photoshop Pirataria planilha de custo Playstation 3 Plebiscito Pneumologia Podcast Poesia Poítica Politica Política Portugal português Pós-graduação prazo médio Pré-sal Prêmio Nobel primatologia Primeira Guerra Mundial privacidade produtividade professor Hamilton Alves Programa Gratuito Programação Projeção Mapeada Projeto Truco Promoção Propaganda Psicanálise Psicologia Psicologia Animal Psiquiatria Pública publicidade Publieditorial Quadrinhos Quads Qualidade Qualidade de Vida química realidade aumentada realidade diminuída Realidade Misturada Realidade Virtual Reconhecimento de imagem Reconhecimento de voz Recorde Redação redes Referência Referendo Reforma Política Reino Unido Relacionamento Relações Internacionais Religião Responsabilidade Social Retrospectiva Review Rio 2016 Rio de Janeiro Rio Grande do Norte Rio Grande do Sul robótica Roda Viva Roma roteiro RSA Rússia Samsung Sanitarismo Santa Catarina São Paulo Saúde Savant Segunda Guerra Mundial Segurança Segurança da Informação Seleção Natural Séries serviço Serviço Online Sexologia sexualidade Show SIGGRAPH Simulação Singularity University Síria Sismologia Sistema operacional Sistemas de Numeração Sites de Busca Sociedade Sociologia Software Software Livre Sol Sono Sony SOPA Star Wars Suécia Sugestão de presentes Sun supercomputadores Sustentabilidade Tabagismo Taiwan Talento precoce taxa de juros efetiva taxa de juros nominal Taxas Equivalentes Taxidermia Teatro Técnicas de Estudo Tecnologia Tecnologia da Informação TED TED-Ed TedMed TEDx TEDx Rio+20 TEDxAmazônia TEDxAsaSul Telefonia Televisão Temas Tempo Tendências Teologia teoria das supercordas Terremoto Terrorismo Testes Tipologia Tomada de Decisão tradução Trânsito transporte tributo Trigonometria Tubarão Tunísia Turismo Tutorial Twitter Uber UFC UFG ufologia UFRJ Unicamp UNIFESP universidade Universidade Corporativa Universidade de Cambridge Universidade de Michigan Urbanismo Urologia USP Utilidade Pública Utilitário Vale Vaticano Veículo Autônomo Ventriloquismo Verão vestibular Vestimenta Vida Digital Vida Moderna Vida Selvagem Videogame Vídeos Vídeos 360 Violência Vírus Visão Computacional Vôlei Vulcanologia Watergate Política WCIT 2016 WCIT 2017 Web 2.0 Web Application Web Semântica Web Seminar webdesign Webinar widget WikiLeaks Wikipedia Windows Xadrez YouTube Zika Zoologia
false
ltr
item
Brasil Acadêmico: Google ensina formiga a jogar bola
Google ensina formiga a jogar bola
https://1.bp.blogspot.com/-1924jkhpZos/V2iRWqWbiKI/AAAAAAAAmE8/iWh2OHeZxKAJmSm0OYfgAHs8iTHJSMopQCLcB/s320/dqn.jpg
https://1.bp.blogspot.com/-1924jkhpZos/V2iRWqWbiKI/AAAAAAAAmE8/iWh2OHeZxKAJmSm0OYfgAHs8iTHJSMopQCLcB/s72-c/dqn.jpg
Brasil Acadêmico
http://blog.brasilacademico.com/2016/06/google-ensina-formiga-jogar-bola.html
http://blog.brasilacademico.com/
http://blog.brasilacademico.com/
http://blog.brasilacademico.com/2016/06/google-ensina-formiga-jogar-bola.html
true
3049085869098582068
UTF-8
Nenhuma artigo encontrado. VER TODOS Leia mais Responder Cancelar resposta Apagar Por Início PÁGINAS POSTS Ver Todos Indicado para você CATEGORIA ARQUIVO BUSCA TODOS ARTIGOS Nenhum artigo corresponde ao critério procurado Ir para Início Domingo Segunda Terça Quarta Quinta Sexta Sábado Dom Seg Ter Qua Qui Sex Sáb Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez agora 1 minuto atrás $$1$$ minutes ago 1 hora atrás $$1$$ hours ago Ontem $$1$$ days ago $$1$$ weeks ago mais de 5 semanas atrás Seguidores Seguir Este conteúdo é PREMIUM Por favor, compartilhe para liberar Copiar todo o código Selecionar todo o código Todos os códigos foram copiados para o clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy