$hide=/p/valores.html

IA coloca som ambiente no Google Street View

Consegue imaginar como seria o som de um determinado local só de ver sua foto? Sim? Pois agora a inteligência artificial também consegue.

Consegue imaginar como seria o som de um determinado local só de ver sua foto? Sim? Pois agora a inteligência artificial também consegue.

O Imaginary Soundscape, um projeto nipônico, treinou uma IA para inserir sons ambientes em locais do Google Street View ou em uma imagem que você mesmo pode enviar. Usando vídeos para realizar o treinamento de duas redes neurais, o sistema passou a associar sons com imagens e cria de forma
autônoma uma atmosfera sonora para a imagem que estivermos visualizando.

Para experimentar basta acessar o site imaginarysoundscape.net e inserir o nome de um local ou um endereço ou mesmo subir o arquivo de uma foto que o sistema detecta se há um céu, pessoas, etc. Aí, com base nestas informações ele coloca o som de conversas (e até mesmo adequar o idioma ao local da cena), aviões passando, sons de trânsito de veículos, etc.  Muito semelhante ao modo como os seres humanos imaginam a "trilha sonora" dos ambientes.

Clique     Retroceder    Avançar   Espaço /    /   F


É uma ideia interessante mas que ainda está longe da perfeição. Ainda tem muito o que aperfeiçoar. Com poucos minutos de teste, por exemplo, percebi que há um excesso de efeitos sonoros como sirenes, motos barulhentas e sons de aviões. O som da irritante sirene talvez tenha sido inspirado em uma portiola vermelha de onde se guarda a mangueira de incêndio que figurava na fachada de um prédio na minha vizinhança.

Imagem de um campus de centro acadêmico em Brasília (Fonte: Google Street View)
Ao colocar um campus de um centro universitário logo rugia sons de motores de carros de corrida. Muito provavelmente da Fórmula 1. Isso porque surgia a imagem de uma "pista" coberta para pedestres. Essa tecnologia se mostra estar ainda naquele estágio que serve mais para dar razão aos céticos sobre as previsões sobre o que a IA vai nos proporcionar no futuro do que para nos dar uma mostra de sua "perfeição" sobrehumana.

Este trabalho baseia-se no recente desenvolvimento da técnica de recuperação de informações intermodais, como imagem-para-áudio, texto-imagem, usando aprendizagem profunda (deep learning). Com entradas de vídeo, o sistema foi treinado com dois modelos: um modelo de reconhecimento de imagem pré-treinado e bem estabelecido, processa os quadros, enquanto outra rede neural convolucional lê o áudio como imagens de espectrograma, evoluindo para que a distribuição de sua saída fosse o mais próximo possível da primeira.
Uma vez treinadas, as duas redes nos permitem recuperar o arquivo de som de melhor correspondência para uma cena, fora do nosso enorme conjunto de dados de som ambiental.

As paisagens sonoras geradas pela IA às vezes nos surpreendem ao atender nossa expectativa, mas ocasionalmente ignoram o contexto cultural e geográfico (o som das ondas em um campo gelado da Groenlândia, por exemplo). Essas diferenças e erros nos levam a contemplar como a imaginação funciona e quão férteis são os ambientes sonoros que nos cercam.

Ao externalizar nossos pensamentos sinestésicos, tentamos lançar luzes sobre o poder da imaginação que todos compartilhamos.
Trecho retirado e traduzido da sessão "Sobre" (About)

Todavia, parece funcionar bem quando você opta por clicar em Random e viajar pelas sugestões da página. E para quem saber ver uma árvore ao examinar uma semente isso é o só o começo de uma evolução que trará soluções que farão automaticamente a sonoplastia de filmes inteiros, e não só a música, mas até mesmo a correta colocação de sons de golpes em uma sequência de luta, por exemplo.


Alguém pensou em desemprego de sonoplastas na indústria de produção audiovisual? 🙋 É esperar para conferir... Por ora, vamos aproveitar o que há de positivo e ver como está o estágio atual da tecnologia.
Apresentado em outubro de 2018, o código do IS está disponível no github.


Fonte: WWWhatsnew [Visto no Brasil Acadêmico]

Comentários

BLOGGER

$hide=/p/valores.html

[/fa fa-cloud/ Nuvem de Categorias]$hide=mobile

Nome

#existepesquisanobrasil A divulgar Abelha Acessibilidade acessório Acidente Acidentes Acústica Adágios Adestramento Administração adulto Aerodinâmica Aeronáutica África Agência Brasil Agência Fiocruz Agência Porvir Agência Senado Agência USP Agricultura Agropecuária AIDS AirBNB Alcoolismo Alemanha Alerta Algoritmo Alimento Alzheimer Amazon Amazônia América Latina Análise Combinatória Anatomia Android Animação Animais de Estimação Animal Antropologia Apicultura App Apple Apresentação aquário Argentina Arqueologia arquitetura Arte Astrobiologia Astrofísica Astronomia Ativismo Áudio Audio FX Áustria Autismo Auto-ajuda Automobilismo Automóvel aventura Aviação Aviônica Bahia Balonismo Banco de Dados Beber e Dirigir biblioteconomia Bicicleta Biografia Biologia Biologia Marinha bioquímica Biotecnologia Bitcoin Blog Blogger Boato Bomba borderô de desconto Botânica BRASA BRASA Leads Brasil Brasília BRIC Browser Bugs CAD Calor Câmera lenta Campanha cardiologia Carnaval carreira Cartografia Casemods Caso Isabella Nardoni Caso Snowden Ceará Celebridades celular Células-Tronco Cérebro Charge China Cibercultura Ciclovia Cidadania Ciência Cinema Clip Cliparts Cloud computing Coaching Comédia competência Complemento de dois Comportamento Computação Computação em grade Computação forense Computação Gráfica Computação Móvel Comunicação e Marketing Concurso Concurso Cultural de Natal Concursos Público Concursos Públicos Conectômica Conferência Congresso em Foco Conspiração Consumidor Consumismo contabilidade Contos Copa do Mundo Cordel Coreia do Norte Coreia do Sul Corpo Coruja cosmética Cosmologia Crash Course Criança Criatividade Crime Crime Digital crise crise econômica crônica crônicas Cronologia CSS Cuba Culinária Cultura Curiosidades custos fixo custos variáveis Dança DAO Darwin Davos Debate Decoração demência Demografia Denúncia Dermatologia Desastre Natural Descoberta desconto duplicatas Desenho instrucional Desenvolvimento de jogos Design Design Instrucional Destaque Dia das Mães Dia do professor diabetes Dicas Didática Dieta diplomacia Direito Direito Eleitoral Direito Internacional Direito Trabalhista Direito Tributário Direitos Autorais Direitos Humanos Disney Distrito Federal Documentário Doutorado download Drogas Drone Dubai e-Book e-governo EBC Ecologia Economia Editoração Eletrônica Educação Educação a Distância Educação Corporativa educação física Educação sexual Efeitos Sonoros Egiptologia Eleições Eleições 2014 Eleições 2018 Eletricidade eletrônica Em Operários Embrapa empreendedorismo enciclopédia endocrinologia Enem Energia Energia Alternativa Energia Nuclear Engenharia Engenharia Agrícola Engenharia Civil Engenharia de materiais Engenharia de Software Engenharia Genética Engenharia Mecânica Enretenimento Ensino a Distância Ensino Superior Entomologia Entretenimento Entrevista Entrevista. Epidemiologia Epistemologia Equador Escândalo Escritório Espaço Espanha Espanhol Espeleologia Espetáculo Espionagem Esporte Estação Estágio Estatísticas estrutura de dados Ética EUA Europa Evento Evolução Exercícios físicos Exobiologia experiência fábulas Facebook Farmacologia Favo Feminismo Férias Ferramentas FIFA Filantropia Filmes Filosofia Finlândia Firefox Física Física Quântica Fisiologia Fisioterapia Flagrante Flamengo Folclore Fome Fonética Fonoaudiologia Fotografia Fotos em 360 graus França Francês frases Fraude Freeware Futebol Futurologia gadget Gafe Gamificação Gastroenterologia Gastronomia Geek Genética Geofísica Geografia Geologia Geometria geopolítica Gerenciamento do Tempo Geriatria Gestão de Competências Gestão de Configuração Gestão de Pessoas Gestão de Projetos Gestão do conhecimento Ginecologia Glass Google Governo GPS Gradiente gramática Gravidez Grécia Grécia Antiga Guerra Guerra Civil Guinness H2 Haiti hardware História HIV Hololens homenagem Horologia HPV HTML Humor Humor Negro IBGE IBM ICIJ Idioma IHC ilo ilusão ilusionismo Imagem 3D Imagens Imagine Cup Império Romano Imprensa Impressora 3D Imunologia Incêndio Inclusão digital Índia Índios Infectologia Infográfico Informática Inglaterra Inglês Inovação Inspiração Inteligência Artificial intercâmbio Interface Interfaces Hápticas Internacional Internacionalização da Amazônia Internet Internet das Coisas Inundação Invenção Inventos iPad IPEA iphone Irã Iraque Israel Japão Java Java. jogos Jogos educativos Jogos Olímpicos Jornalismo Justiça Kinect Le Monde Diplomatique Brasil Le Monde Diplomatique Brasil Letras Lexicografia Liderança Life Hacking Linguística Literatura Livro Lógica Logística Loterias Lua Maçonaria Malásia Malvinas Malware Mapa Mário Sérgio Conti Marte Mastologia Matemática Matemática Financeira maternidade Mecânica Mecânica dos Fluidos Mecatrônica Medicina Medicina Esportiva Medicina Veterinária Meio Ambiente Mel melanoma Memória memorização Mente Mercado de Trabalho mercosul Mestrado meteorologia Metodologia Científica México Microbiologia Microsoft Mídia Social Militar Mineralogia Mistério MIT Mitologia Mobilidade Mobilidade Urbana MonaVie Montanhismo Moodle Mossad Motivação Movimento Maker MSF Mudança Climática Mulher Multimídia museu Música MVC Nanotecnologia Nasa Natação Natal Natureza Negócios Netflix Neurociência Neurologia Nicolelis Nordeste Noruega notícias Novidades Novo Enem Números Nutrição Obama Obesidade Observatório da Imprensa Obstetrícia Oceanografia odontologia Offshore Leaks oftalmologia Olimpíadas oncologia ONU Opinião Óptica Oracle Oriente Médio Orkut Ornitologia ortografia Ortopedia Ótica Otorrinolaringologia Oxfam Pacifismo Paginadores paleontologia Paquistão Pará Paraguai parkinson Passeio virtual Patinação Pedagogia Pediatria Pensamentos performance Periférico Pesca Pesquisa Petição Petrobrás Petróleo Photoshop Pirataria planilha de custo Playstation 3 Plebiscito Pneumologia Podcast Poesia Poítica Politica Política Portugal português Pós-graduação prazo médio Pré-sal Prêmio Nobel primatologia Primeira Guerra Mundial privacidade produtividade professor Hamilton Alves Programa Gratuito Programação Projeção Mapeada Projeto Truco Promoção Propaganda Psicanálise Psicologia Psicologia Animal Psiquiatria Pública publicidade Publieditorial Quadrinhos Quads Qualidade Qualidade de Vida química REA realidade aumentada realidade diminuída Realidade Misturada Realidade Virtual Reconhecimento de imagem Reconhecimento de voz Recorde Recoverit Recuperar vídeos Redação redes Referência Referendo Reforma Política Reino Unido Relacionamento Relações Internacionais Religião Responsabilidade Social Retrospectiva Review Rio 2016 Rio de Janeiro Rio Grande do Norte Rio Grande do Sul robótica Roda Viva Roma roteiro RSA Rússia Samsung Sanitarismo Santa Catarina São Paulo Saúde Savant Segunda Guerra Mundial Segurança Segurança da Informação Seleção Natural Séries serviço Serviço Online Sexologia sexualidade Show SIGGRAPH Simulação Singularity University Síria Sismologia Sistema operacional Sistemas de Numeração Sites de Busca Sociedade Sociologia Software Software Livre Sol Sono Sony SOPA Star Wars Suécia Sugestão de presentes Sun supercomputadores Sustentabilidade Tabagismo Taiwan Talento precoce taxa de juros efetiva taxa de juros nominal Taxas Equivalentes Taxidermia Teatro Técnicas de Estudo Tecnologia Tecnologia da Informação TED TED-Ed TedMed TEDx TEDx Rio+20 TEDxAmazônia TEDxAsaSul Telefonia Televisão Temas Tempo Tendências Teologia teoria das supercordas Terremoto Terrorismo Tesla Testes Tipologia Tomada de Decisão tradução Trânsito transporte tributo Trigonometria Tubarão Tunísia Turismo Tutorial Twitter Uber UFC UFG ufologia UFRJ Unicamp UNIFESP universidade Universidade Corporativa Universidade de Cambridge Universidade de Michigan Urbanismo Urologia User Experience USP Utilidade Pública Utilitário Vale Vaticano Veículo Autônomo Ventriloquismo Verão vestibular Vestimenta Vida Digital Vida Moderna Vida Selvagem Videogame Vídeos Vídeos 360 Violência Vírus Visão Computacional Vôlei Vulcanologia Watergate Política WCIT 2016 WCIT 2017 Web 2.0 Web Application Web Semântica Web Seminar webdesign Webinar widget WikiLeaks Wikipedia Windows Xadrez YouTube Zika Zoologia
false
ltr
item
Brasil Acadêmico: IA coloca som ambiente no Google Street View
IA coloca som ambiente no Google Street View
https://1.bp.blogspot.com/-rIujARHaRnE/XLFwRTfBJlI/AAAAAAAA7rQ/MSwjar6O_gMdvxQ7gCWND7DBfH-GwnyPACLcBGAs/s1600/n45.jpg
https://1.bp.blogspot.com/-rIujARHaRnE/XLFwRTfBJlI/AAAAAAAA7rQ/MSwjar6O_gMdvxQ7gCWND7DBfH-GwnyPACLcBGAs/s72-c/n45.jpg
Brasil Acadêmico
http://blog.brasilacademico.com/2019/04/ia-coloca-som-ambiente-no-google-street.html
http://blog.brasilacademico.com/
http://blog.brasilacademico.com/
http://blog.brasilacademico.com/2019/04/ia-coloca-som-ambiente-no-google-street.html
true
3049085869098582068
UTF-8
Nenhuma artigo encontrado. VER TODOS Leia mais Responder Cancelar resposta Apagar Por Início PÁGINAS POSTS Ver Todos Indicado para você CATEGORIA ARQUIVO BUSCA TODOS ARTIGOS Nenhum artigo corresponde ao critério procurado Ir para Início Domingo Segunda Terça Quarta Quinta Sexta Sábado Dom Seg Ter Qua Qui Sex Sáb Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Jan Fev Mar Abr Maio Jun Jul Ago Set Out Nov Dez agora 1 minuto atrás $$1$$ minutes ago 1 hora atrás $$1$$ hours ago Ontem $$1$$ days ago $$1$$ weeks ago mais de 5 semanas atrás Seguidores Seguir Este conteúdo é PREMIUM Por favor, compartilhe para liberar Copiar todo o código Selecionar todo o código Todos os códigos foram copiados para o clipboard Can not copy the codes / texts, please press [CTRL]+[C] (or CMD+C with Mac) to copy