Talvez você já tenha escutado que "os dados são o novo petróleo" – possivelmente, aqui mesmo no canal nas séries de Análise de Dados com Python ou de Machine Learning. Fato é que dados são preciosos e também são escassos. Mesmo com a quantidade gigantesca de dados produzida diariamente por nossas interações na internet, não temos dados suficientes para treinar modelos de aprendizado de máquina (machine learning) para realizar, com precisão, qualquer tipo de tarefa.
Neste vídeo, vamos comentar sobre algumas das restrições e dificuldade de se trabalhar com dados para treinar modelos de aprendizado de máquina e como elas motivam estudos sobre a geração de dados sintéticos para treinar esses modelos de inteligência artificial. Se você quiser saber mais sobre este tópico de geração de dados sintéticos, convidamos você a assistir a uma série especial de seminários do laboratório VISGRAF, o laboratório de Visão Computacional de Computação Gráfica do IMPA, onde o Hallison faz doutorado. As palestras serão transmitidas ao vivo no canal do @visgraf e você já pode ativar o lembrete para receber notificações.
– Por que dados sintéticos são importantes? • VISGRAF Lab Webinar - Hallison da Paz...
Uma das formas mais comuns de se treinar modelos de aprendizado de máquina é chamada de aprendizado supervisionado. Nesta abordagem, nós queremos que o computador seja capaz de estimar uma função, que tem que atender a determinadas hipóteses, a partir de exemplos de entrada, ou seja o que queremos que o modelo avalie, e exemplos de saída, a resposta que queremos que ele dê. Contudo, a necessidade de uma pessoa avaliar cada exemplo do conjunto de dados e realizar anotações que sejam úteis para cada tipo de aplicação de pesquisa faz com que o custo de aquisição e preparação desses dados seja bastante elevado.
O custo é apenas uma das dificuldades neste processo. Há dados que podem ser muito difíceis de um ser humano anotar como, por exemplo, máscaras de segmentação em imagens. Você conseguiria marcar, com precisão e diversas vezes, todos os pixels que representam um animal em uma imagem? E será que essas imagens têm direitos autorais? Será que ferem a privacidade de alguém? O conjunto de dados tem exemplos o suficiente? Há balanceamento entre as classes?
Seja por questões técnicas ou éticas no uso da inteligência artificial, os dados sintéticos podem ser uma solução alternativa – e as pesquisas indicam resultados promissores. É claro, que há outras questões que se tornam importante com essa abordagem, por exemplo:
– As imagens geradas precisam ser foto-realistas?
– Tem que misturar com imagens reais?
– Funciona direitinho nas imagens reais depois?
Essas são algumas das perguntas que você pode ter, pra começo de conversa. Afinal, queremos treinar modelos que funcionem bem no mundo real, apesar de treiná-los em dados sintéticos. Neste vídeo, viemos instigar a sua curiosidade para que, caso você queira saber mais, venha conferir os seminários que o Hallison dará sobre geração de dados sintéticos e treinamento de modelos com eles. Na primeira palestra, aprofundaremos a discussão deste vídeo com a motivação para uso de dados sintéticos e os cuidados que devemos ter em mente nesta abordagem. Na segunda palestra, falaremos mais sobre a geração dos dados em si, inclusive, usando uma engine de games que talvez você já conheça, a Unity. E na terceira palestra, vamos falar sobre algo mais além, sobre aprendizado de máquina dentro de simulações!
▶️ Confira o site do seminário: https://visgraf.github.io/syntheticle...
– Vídeos relacionados:
1. A Próxima Fronteira do DEEP LEARNING | Representações de Dados 3D • A Próxima Fronteira do DEEP LEARNING...
2. Treinando Robôs em uma simulação (NVidia GTC-2021) • Treinando Robôs em uma simulação (NVi...
3. BIOMETRIA não é só sua DIGITAL @Peixe Babel • BIOMETRIA não é só sua DIGITAL | Bit ...
4. O que é Machine Learning • O que é MACHINE LEARNING? Introdução ...
📚 Livros recomendados de Data Science: https://amzn.to/2XZyxUr
📚 Livros de Algoritmos e Estruturas de Dados: https://amzn.to/3d5wK4m
SetUp - Equipamentos: https://amzn.to/37Cg3N2
🟣 Canal na Twitch para lives: / pgdinamica
🟦 Canal do Telegram para receber os vídeos: https://t.me/joinchat/AAAAAFaoNgZTMRv...
✉️ E-mails:
– Propostas comerciais: [email protected]
– Demais assuntos: [email protected]
📸 Nos siga no Instagram: / pgdinamica
📸 @kizzy_terra @hallpaz
🐦 Nos siga no Twitter: / pgdinamica
🐦 @kizzy_terra @hallpaz
Curta a Programação Dinâmica no facebook: fb.com/pgdinamica
Nosso repositório no Github: github.com/programacaodinamica
Confira o nosso Medium: medium.com/programacaodinamica
Confira os artigos no Python Café: pythoncafe.com.br
🥰 Se você gosta do nosso trabalho e acha relevante a nossa atuação no Youtube, considere nos apoiar se tornando membro do canal: https://www.youtube.com/programacaodi...
Watch video Aprendizado de Máquina Supervisionado e Dados Sintéticos para IA | Diário de Pesquisa #16 online without registration, duration hours minute second in high quality. This video was added by user Programação Dinâmica 06 May 2021, don't forget to share it with your friends and acquaintances, it has been viewed on our site 2,769 once and liked it 358 people.