Semana de Dados 2023: Aplicações e Tecnologias

Aug 19, 2024

Semana de Dados 2023

Introdução

  • Evento que reúne especialistas da área de dados.
  • Objetivo: Demonstrar uso de dados nas empresas, cases, novas tecnologias e promover debates.
  • Hoje, foco técnico: Criar aplicação com potencial de gerar valor para negócios.

Tutorial: Treinando o ChatGPT com seus Dados

Objetivo

  • Desenvolver um chat assistente.
  • Usuários podem acessar e fazer perguntas sobre a empresa.
  • Baseado no conhecimento público da empresa.

Tecnologia Utilizada

  • Web Scrapping para extrair dados do site da empresa.
  • Processamento de Linguagem Natural (NLP) para enriquecer dados.
  • API da OpenAI para treinar o modelo de chat.

Etapas do Tutorial

  1. Web Scrapping

    • Extração de conteúdo textual do site da empresa.
    • Utilização de técnicas de web scrapping para coleta de dados.
  2. Tokenização

    • Dividir texto em tokens, partes menores para processamento.
    • Importância no processamento de linguagem natural.
  3. Embeddings

    • Técnica para entender relação semântica e sintática entre palavras.
    • Vetorização dos tokens para análise semântica.
  4. Treinamento do Modelo

    • Utilização da API da OpenAI.
    • Criação de embeddings para entendimento semântico.
  5. Desenvolvimento de Interface

    • Implementação de interface para interação com chat assistente.

Ferramentas e Linguagens

  • Linguagem Python: Ambiente de desenvolvimento.
  • Biblioteca de Web Scrapping, processamento de dados, e interface.

Considerações Finais

  • Aplicações possíveis para empresas com grande volume de documentos ou dados não estruturados.
  • Utilização em setores como atendimento ao cliente, busca de documentos internos, conhecimento técnico, análise de currículos.

Contato e Disponibilidade

  • Disponível para feedback e discussões sobre casos de uso.
  • Contato através das redes sociais e QR Code para conexão.

Notas Adicionais

  • Importante verificar termos de uso dos sites antes de realizar web scrapping.
  • OpenAI oferece créditos para novos usuários para experimentar a API.
  • Documentação e slides disponíveis para consulta futura.