Roteiro de aplicativos de IA: a controlabilidade é o roteiro mais forte

Fonte: Semi-Light See More

Autor: Wang Yonggang

  • Wang Yonggang: Fundador e CEO do SeedV Lab, Reitor Executivo do Innovation Works AI Engineering Institute
  • Tong Chao: Cofundador e Chefe de Produto do SeedV Lab

Onde estão os cenários de aplicação da IA generativa

Tecnologias generativas de IA, como Stable Diffusion e ChatGPT, atraíram mais atenção do círculo de capital de risco de TI no primeiro semestre de 2023. Quando nos recuperarmos da magnífica onda de novas tecnologias e começarmos a pensar seriamente sobre que tipo de cenários de aplicação são as melhores direções de implementação para IA generativa, muitas pessoas ainda acharão que a relação entre tecnologia e mercado é intrincada, é difícil resolver o melhor caminho para a implementação da IA generativa:

  • Um investidor: Nos últimos meses, todas as instituições de capital de risco da linha de frente foram mobilizadas e estão muito ocupadas. Acontece que, exceto por quatro ou cinco projetos empresariais modelo de grande escala que são procurados por todos, outros AIGC os projetos não são claros e não ousam investir. , Não sei onde os aplicativos de IA se desenvolverão no futuro.
  • Um analista: Vários projetos de modelo de grande escala líderes investiram pesadamente e têm altos riscos; todos os aplicativos do lado B e do lado do governo são limitados pela implantação privada e dados privados, têm um ciclo longo e são difíceis de implementar; a maioria C Os aplicativos laterais são muito rasos e a homogeneidade dos projetos de geração de texto e imagem é grave; é comum iniciar um negócio após um ou dois bons trabalhos, mas a própria equipe não consegue descobrir a direção específica do aplicativo. ..

O maior cerne do pensamento aqui é:

  • A maioria das pessoas ainda pensa inconscientemente em IA generativa como um conjunto de ferramentas para gerar diálogos, artigos e imagens. De acordo com este estereótipo: essa coisa só pode ajudar redatores e designers a melhorar a eficiência, como pode ser chamada de mudança subversiva?
  • Embora existam muitos sinais de que a IA generativa está mostrando o surgimento da inteligência artificial geral (AGI), as pessoas limitadas por julgamentos de valor de curto prazo sempre dirão: e daí? ver é crer. A IA de hoje ainda não está conversando, escrevendo artigos e desenhando?

Obviamente, não é aconselhável analisar as perspectivas de aplicação da IA generativa apenas de uma única perspectiva ou de um único nó de tempo. Existe um modelo de pensamento simples e fácil de usar que conecte o desenvolvimento da IA generativa?

Construa um modelo de pensamento em torno da controlabilidade

Acreditamos que a IA generativa é uma revolução da indústria da informação que pode ser comparada com a computação de desktop e a computação móvel, e ainda tem um efeito mais subversivo. Mudanças disruptivas nunca são alcançadas da noite para o dia, mas são realizadas gradualmente com o desenvolvimento e progresso contínuos da IA generativa. Se você quiser ver claramente quais novos produtos, novas plataformas, novos mercados e novas oportunidades a IA generativa trará, acreditamos que existe um caminho de pensamento simples e fácil de entender que pode orientar a seleção de produtos e a seleção de projetos:

**Quanto mais controlável for a IA generativa, mais disruptiva ela será para o mercado e a indústria! **

Este caminho pode ser simplesmente representado por um gráfico:

À medida que a capacidade de controle da IA generativa sobre o conteúdo gerado continua a melhorar, os cenários de aplicação aplicáveis à IA generativa continuarão a se expandir e se aprofundar. A mudança quantitativa leva à mudança qualitativa. Uma vez que o limite do domínio é ultrapassado, a IA generativa pode transformar completamente a ecologia do produto existente e dotar os produtos com elementos verdadeiramente inteligentes.

Durante o processo de evolução, a capacidade de controle da IA generativa passará por seis estágios. Tome a geração de texto mais básica como exemplo:

Fase 1: Incontrolável

Há mais de 20 anos, o modelo estatístico de linguagem baseado no algoritmo N-grams também podia gerar conteúdo de texto contínuo. No entanto, os resultados resultantes são em grande parte incontroláveis. Essa forma inicial de "IA generativa" quase não tem possibilidade de ser transformada em produtos, muito menos de subverter o mercado existente.

Fase 2: A direção geral é controlável

Da geração de texto baseada em LSTM ou RNN à geração de texto inicial GPT (como GPT-2), a IA generativa adquiriu gradualmente a capacidade de descrever um pedaço de linguagem semelhante à humana. A capacidade de descrever neste estágio pode basicamente alcançar frases fluentes, e o conteúdo está em conformidade com as instruções dadas por humanos. No entanto, como os detalhes, a estrutura ou a lógica são incontroláveis, ainda é difícil transformá-lo em um produto verdadeiramente útil.

Fase 3: Estrutura controlável ou lógica local

Do GPT-3 ao ChatGPT (GPT-3.5), pela primeira vez, a IA generativa tem controle sobre a estrutura e a lógica local do conteúdo gerado. A criação de texto e as conversas em várias rodadas são duas ecologias de aplicativos típicas nesse período. O primeiro pode oferecer suporte a cenários práticos, como resumo automático de artigos, geração de documentos jurídicos e geração de cópias de marketing, enquanto o último pode atender a algumas necessidades de pesquisa conversacional, aprendizado de idiomas, atendimento inteligente ao cliente, pessoas virtuais e personagens de jogos inteligentes.

Fase 4: A cadeia preliminar de pensamento é controlável

De GPT-3.5 a GPT-4, a capacidade de raciocínio lógico da IA generativa melhorou significativamente. Pela primeira vez, a IA generativa possui recursos analíticos poderosos (como extrair dados de notícias e resumir tendências), recursos de controle (como converter a linguagem humana em instruções complexas de controle do sistema) e recursos de raciocínio lógico preliminar (como responder a perguntas simples matemática, problemas de lógica). O conteúdo de texto que pode ser gerado também se estende a textos estruturados e semiestruturados, como dados, tabelas, códigos, sequências de instruções, fluxos de trabalho ou cadeias de ferramentas. Isso levou diretamente a um grande número de novas ferramentas e sistemas hoje caracterizados por Copilot (traduzido literalmente como "co-piloto").

Fase 5: O raciocínio lógico complexo é controlável

Claro, quando o GPT-4 de hoje gera texto, a cadeia de pensamento lógico que pode ser controlada ainda está em sua infância. Se tudo correr bem, espera-se que os humanos desenvolvam uma IA generativa de próxima geração que possa controlar com precisão o raciocínio lógico complexo em um futuro não muito distante. Essa IA possui recursos avançados de raciocínio lógico, como memória, aprendizado, planejamento e tomada de decisão. Esses recursos são suficientes para subverter completamente a forma de interação humano-computador nas últimas décadas e redefinir a relação entre humanos e computadores em cenários como ferramentas de eficiência, plataformas de conteúdo, automação de processos de negócios, robôs, sistemas operacionais e dispositivos inteligentes.

Fase 6: regras ou princípios controláveis

De uma perspectiva mais voltada para o futuro, as manifestações de mais alto nível do pensamento humano são: 1. Descobrir princípios e formular regras com base no pensamento indutivo 2. Aplicar princípios ou regras a cenários específicos com base no pensamento dedutivo. A forma evolutiva ideal da IA generativa é abordar o modo de pensar humano, gerar regras ou princípios comparáveis ao pensamento humano e aplicá-los. Assim que atingir o "Reino da Liberdade", onde as regras ou princípios são controláveis, a IA generativa terá uma forte capacidade de iterar e melhorar a si mesma, podendo projetar regras de sistema e regras mundiais como humanos, e até mesmo realizar pesquisas científicas com cientistas humanos. .

Controlabilidade e Direção de Aplicação Típica

A melhoria da controlabilidade da IA generativa trouxe uma expansão substancial do campo aplicável. Usamos a figura a seguir para resumir a relação entre a controlabilidade e a melhor direção de aplicação da IA generativa em diferentes estágios de desenvolvimento:

Com base na capacidade de controle, em cada estágio de desenvolvimento, as direções de aplicativos suportadas pela IA generativa continuam a se expandir e aprofundar, desde a satisfação de necessidades simples e locais, até o desenvolvimento gradual para atender às necessidades de domínio e plataforma e, finalmente, acumulando-se no produto e no modelo de negócios. mudança disruptiva. Se a cadeia de pensamento e raciocínio lógico são controláveis, e até que ponto eles podem ser controlados com precisão, são os fatores mais críticos no processo de mudança quantitativa para mudança qualitativa.

Controlabilidade e casos de aplicação específicos

Com base na capacidade de controle da IA generativa, dividimos as direções de aplicação mais adequadas da IA generativa hoje e no futuro próximo em quatro categorias e usamos a figura a seguir para comparar os casos de aplicação típicos em cada categoria com a aplicação da IA generativa. diferentes estágios de desenvolvimento estão ligados:

Ferramenta de Criação de Conteúdo/Plataforma de Conteúdo

As ferramentas de criação de conteúdo são o cenário mais direto e rápido para implementação de IA generativa. Com a melhoria da capacidade de controle da IA generativa, as tarefas de criação de conteúdo passarão da criação simples de texto e imagem para a criação automática complexa de vídeos, 3D, animações, jogos, filmes, mundos virtuais, etc. Com a ajuda da IA, cada pessoa comum terá habilidades que originalmente pertenciam apenas a equipes profissionais e ferramentas profissionais. Uma vez que o desejo criativo das pessoas comuns é amplamente liberado, as necessidades de nível superior para compartilhar, assistir, comprar e socializar em novas formas de conteúdo definitivamente impulsionarão o nascimento, o desenvolvimento e o crescimento de uma nova geração de plataformas de conteúdo.

Automação Comercial/Serviços Empresariais

Devido a razões como segurança de dados, implantação privada, precisão de conteúdo e conformidade, os processos de negócios têm requisitos muito altos para a controlabilidade da IA generativa. As áreas de negócios onde a IA generativa é mais adequada hoje podem incluir criação de conteúdo em marketing e interfaces de usuário em e-commerce. Além disso, a IA generativa também pode melhorar muito a eficiência dos negócios, gerando automaticamente códigos intermediários, como SQL, coleta e análise automática de dados, geração automática de relatórios e conexão automática de processos de negócios. No futuro, com a melhoria da capacidade de controle da IA generativa, mais tecnologias de IA de ponta serão absorvidas em processos-chave, como planejamento, tomada de decisões e otimização em processos de negócios.

Assistente Pessoal/Assistente Profissional

Na vida pessoal e em cenários de escritório, a IA generativa servirá gradualmente como várias formas de "assistentes" e estabelecerá um novo ecossistema de colaboração humano-IA dentro de alguns anos. O quão controlável é a IA generativa determina fundamentalmente o quão inteligentes são os assistentes de IA em nossas vidas ou trabalho e quais problemas eles podem nos ajudar a resolver. Uma vez que a IA generativa tenha um nível equivalente a secretárias, motoristas, tradutores, advogados, etc. humanos em alguns empregos, os assistentes de IA se tornarão uma nova geração de produtos eletrônicos populares que substituem computadores e telefones celulares.

Infraestrutura/Ferramentas de Desenvolvimento/SO/Mecanismos de Busca

Os recursos de programação, recursos de processamento de dados, recursos de design de sistema e recursos de processamento de conhecimento da IA generativa fornecerão novos conceitos de design e novas funções para ferramentas de desenvolvimento, bancos de dados, mecanismos de pesquisa e sistemas operacionais. Se um sistema operacional com IA como núcleo e uma plataforma de computação inteligente com IA como núcleo pode nascer no futuro depende inteiramente de quão alto pode atingir a capacidade de raciocínio lógico complexo da IA generativa.

Evolução da capacidade de aplicação da IA multimodal

Em comparação com a geração simples de texto e geração de imagens, os sistemas multimodais, incluindo som, vídeo, cenas 3D, animação e enredos complexos, estão mais alinhados com o senso comum humano e as necessidades originais e, obviamente, têm perspectivas de aplicação mais amplas e de longo alcance. Para o status técnico e as perspectivas da IA multimodal, consulte outro artigo do autor deste artigo:

Na era pós-GPT, a multimodalidade é a maior oportunidade No campo da multimodalidade, acreditamos que a IA generativa de hoje e do futuro evoluirá e se acumulará aproximadamente de acordo com o contexto mostrado na figura abaixo e continuará a dar origem a novos aplicativos revolucionários, novas plataformas e até novos modelos de negócios disruptivos:

Permissão de uso

As imagens e o conteúdo de texto de todos os roteiros de aplicativos acima são liberados pelo SeedV Lab sob a licença CC BY 4.0. Com base na indicação da fonte original (laboratório SeedV), todos são livres para usar, modificar e republicar.

As imagens do roteiro do aplicativo acima também são de código aberto nos seguintes locais, bem-vindo à visita (você pode clicar diretamente em [ler o texto original] no final do artigo para visitar):

github.com/SeedV/generative-ai-roadmap

Ver original
O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate.io
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)