Geral
Radzivon Alkhovik
Entusiasta da automação de baixo código
9 de julho de 2024
Uma plataforma de baixo código que combina a simplicidade sem código com o poder do código completo 🚀
Comece gratuitamente
9 de julho de 2024
.
7
min ler

IA Constitucional Coletiva: Alinhando um Modelo de Linguagem com a Contribuição Pública

Radzivon Alkhovik
Entusiasta da automação de baixo código
Índice

Em um experimento inovador, a Anthropic, uma empresa líder Empresa de pesquisa de IA, colaborou com o Collective Intelligence Project para elaborar uma constituição para um Sistema de IA usando a contribuição de uma amostra diversa do público americano. A nova abordagem, chamada "IA Constitucional", visa criar sistemas de IA transparentes e responsáveis ​​ao incorporar princípios legais e éticos diretamente no processo de treinamento da IA. 

Este artigo se aprofunda nas complexidades desta pesquisa inovadora, explorando a metodologia, as descobertas e as implicações de longo alcance para o futuro da governança da IA ​​em uma era em que modelos de linguagem avançados estão se tornando cada vez mais integrados a setores críticos como governança, judiciário e formulação de políticas.

Key Takeaways: O experimento colaborativo entre a Anthropic e o Collective Intelligence Project resultou em uma "constituição pública" para um sistema de IA, elaborado por uma amostra representativa de ~1,000 americanos. A constituição pública de IA enfatiza objetividade, imparcialidade e acessibilidade, e os modelos treinados nela demonstram desempenho comparável àqueles treinados na constituição da Anthropic, ao mesmo tempo em que exibem viés reduzido. O experimento destaca os desafios e considerações na incorporação de contribuição democrática no desenvolvimento de IA, mas representa um passo significativo em direção ao alinhamento de modelos de linguagem avançados com valores humanos.

Você pode experimentar o mais novo AI Anthropic Claude gratuitamente no Latenode

O que é IA constitucional?

Constitutional AI é uma metodologia inovadora desenvolvida pela Anthropic para garantir que os sistemas de IA operem em alinhamento com princípios normativos explícitos, semelhante a como uma constituição governa o comportamento de uma nação. No cerne da Constitutional AI da Anthropic está a definição de um conjunto de valores e princípios de alto nível que servem como estrutura orientadora da IA. Esses princípios são cuidadosamente elaborados para garantir que as ações da IA ​​se alinhem com as normas e expectativas da sociedade, promovendo comportamentos benéficos enquanto minimizam o potencial de resultados prejudiciais.

Para incutir efetivamente esses princípios na IA, a IA Constitucional emprega técnicas avançadas como:

  • Autossupervisão: permite que a IA aprenda com suas próprias experiências e interações, internalizando gradualmente os comportamentos desejados sem a necessidade de supervisão humana constante.
  • Treinamento adversário: ao expor a IA a uma ampla gama de cenários e desafios, essa técnica a ajuda a desenvolver capacidades robustas de tomada de decisão que respeitam os limites éticos e legais predefinidos.

Outro aspecto crítico da IA ​​Constitucional é a curadoria meticulosa dos dados de treinamento e arquitetura da IA. Ao selecionar e pré-processar cuidadosamente os dados usados ​​para treinar a IA, os pesquisadores podem garantir que o sistema seja exposto a um conjunto equilibrado e representativo de exemplos que reforçam os comportamentos e valores desejados. Além disso, a arquitetura da própria IA é projetada para promover o alinhamento com os princípios constitucionais, incorporando mecanismos que incentivam resultados úteis, inofensivos e honestos.

Ao incorporar esses princípios diretamente no processo de tomada de decisão da IA, a IA Constitucional visa criar sistemas que se esforcem proativamente para operar dentro de limites éticos e legais predefinidos. Isso significa que a IA buscará ativamente:

  • Seja útil para os usuários
  • Evite causar danos
  • Forneça informações verdadeiras e precisas

O objetivo é desenvolver Sistemas de IA que não são apenas altamente capazes, mas também inerentemente alinhados com os valores humanos e as expectativas da sociedade.

O desenvolvimento da IA ​​Constitucional representa um passo significativo à frente no campo da governança e ética da IA. Ao estabelecer um conjunto claro de princípios normativos e incorporá-los à funcionalidade central da IA, os pesquisadores podem criar sistemas que são mais transparentes, responsáveis ​​e confiáveis. Essa abordagem tem o potencial de mitigar muitos dos riscos e desafios associados à implantação da IA ​​em domínios críticos, como governança, judiciário e formulação de políticas, garantindo que esses sistemas operem a serviço do bem maior.

Por que IA constitucional?

O desenvolvimento da IA ​​constitucional é impulsionado por diversas motivações convincentes que abordam os desafios críticos impostos pela crescente integração de sistemas de IA em vários aspectos da sociedade:

Salvaguarda ética:

  • A IA constitucional serve como uma salvaguarda ética essencial, garantindo que os sistemas de IA operem em alinhamento com direitos e valores fundamentais.
  • Ao incorporar princípios éticos à funcionalidade central da IA, a IA Constitucional garante a proteção dos direitos individuais e do bem-estar social, especialmente em domínios sensíveis como saúde, finanças e justiça criminal.

Conformidade legal:

  • A IA constitucional é crucial para garantir a conformidade legal em domínios onde a adesão às diretrizes constitucionais não é negociável, como os setores judiciário e de formulação de políticas.
  • Ao incorporar princípios legais ao processo de tomada de decisão da IA, a IA Constitucional reduz o risco de violações não intencionais ou resultados tendenciosos, mantendo a integridade e a justiça dessas instituições.

Confiança e aceitação pública:

  • A IA constitucional promove a confiança pública e a aceitação dos sistemas de IA ao tornar seus princípios orientadores transparentes e acessíveis.
  • Essa transparência promove a responsabilização e ajuda a desmistificar a IA, incentivando maior confiança pública na segurança, confiabilidade e alinhamento desses sistemas com os valores humanos.
  • Promover a confiança é crucial para a adoção generalizada e a integração bem-sucedida de tecnologias de IA em vários aspectos da sociedade.

Mitigação de risco:

  • A IA constitucional ajuda a mitigar riscos potenciais e consequências não intencionais associadas à implantação de sistemas de IA.
  • Ao incorporar proativamente princípios éticos e legais à funcionalidade central da IA, os pesquisadores podem minimizar a probabilidade de esses sistemas causarem danos, perpetuarem preconceitos ou tomarem decisões contrárias aos valores humanos.

Em resumo, a Constitutional AI é motivada pela necessidade urgente de garantir que os sistemas de IA operem de forma ética, legalmente compatível e confiável. À medida que essas tecnologias se tornam cada vez mais integradas em domínios críticos e processos de tomada de decisão, a Constitutional AI fornece uma ferramenta poderosa para criar sistemas de IA que sejam transparentes, responsáveis ​​e inerentemente alinhados com os princípios que sustentam nossa sociedade. Ao priorizar o desenvolvimento e a implantação da Constitutional AI, podemos desbloquear o imenso potencial dessas tecnologias enquanto mitigamos os riscos e desafios que elas representam.

Como você pode democratizar o desenvolvimento de IA com a integração do Сlaude e do Latenode da Anthropic

Integração perfeita do Latenode com a Constitutional AI da Anthropic fornece aos usuários uma ferramenta eficiente para alavancar sistemas de IA alinhados com valores públicos sem a complexidade de gerenciar a infraestrutura de treinamento do modelo. O editor visual intuitivo da plataforma simplifica o processo de integração da Constitutional AI com outros sistemas por meio de APIs, permitindo que as organizações incorporem sem esforço princípios éticos de IA em seus processos de automação. Ao usar o Latenode, os usuários podem acessar convenientemente os recursos da Constitutional AI, incluindo sua mitigação de viés, tomada de decisão ética e recursos de conformidade legal. A integração também permite que os usuários alternem perfeitamente entre diferentes configurações da Constitutional AI da Anthropic, dependendo de suas necessidades e orçamento específicos. Por exemplo, criar um script para um chatbot de atendimento ao cliente que fornece respostas imparciais e éticas é simples.

Veja como é o script:

‍E aqui está o resultado deste cenário, onde um chatbot já criado usando o Latenode fornece uma resposta imparcial a uma consulta do cliente:

Você pode aprender mais sobre esse script e a integração com o Latenode neste artigo. A integração com o Latenode oferece alguns benefícios importantes:

  • Facilidade de uso: A integração da Latenode com a AI Anthropic simplifica o processo de uso da IA, facilitando o acesso e a compreensão dos recursos de IA de que os usuários não técnicos precisam. Isso pode ajudar as empresas a adotar soluções de IA de forma rápida e fácil, sem exigir ampla experiência técnica.
  • Preços flexíveis: A integração do Latenode permite que os usuários escolham entre diferentes versões do Anthropic Claude, com custos e recursos variados, tornando-o uma opção mais acessível e econômica para empresas e indivíduos.
  • Soluções abrangentes de IA: A integração do AI Anthropic Claude pela Latenode fornece aos usuários acesso a uma ampla gama de recursos de IA, desde tarefas complexas até consultas simples, tornando-a uma plataforma de IA versátil e poderosa.
  • Personalização: Com a integração do Latenode, os usuários podem personalizar o Claude para atender às suas necessidades específicas, permitindo que eles criem soluções de IA personalizadas e alinhadas com suas metas e objetivos de negócios.:

Se precisar de ajuda ou conselhos sobre como criar seu próprio script ou se quiser replicar este, entre em contato Nossa Comunidade Discord, onde os especialistas em automação de baixo código estão localizados.

Reconheça o poder da IA ​​Anthropic Claude com Latenode

Projetando um processo de contribuição pública para redigir coletivamente uma constituição

Para explorar o potencial de democratização do desenvolvimento da IA ​​Constitucional Antrópica, Anthropic fez parceria com a Inteligência Coletiva Projeto para conduzir um processo de contribuição pública usando a plataforma Polis. O objetivo era envolver uma amostra representativa de ~1,000 adultos dos EUA na elaboração de uma constituição para um sistema de IA. Os participantes foram convidados a propor e votar em princípios normativos, contribuindo para a geração coletiva de um conjunto de diretrizes para o comportamento da IA.

O design do processo de contribuição pública envolveu diversas decisões críticas:

  • Selecção do Participante: Os pesquisadores buscaram recrutar uma amostra diversa e representativa da população dos EUA, considerando fatores como idade, gênero, renda e geografia. Critérios de triagem foram empregados para garantir que os participantes tivessem familiaridade básica com conceitos de IA.
  • Escolha da plataforma:A plataforma Polis foi selecionada por seu histórico comprovado em facilitar a deliberação e a construção de consenso on-line, bem como por seus recursos colaborativos que permitem que os participantes se envolvam com as ideias uns dos outros.
  • Declarações de sementes: Para orientar a discussão e fornecer um ponto de partida para os participantes, os pesquisadores incluíram um conjunto de 21 declarações-semente como exemplos de princípios em escopo e formatados apropriadamente. Essas declarações foram cuidadosamente escolhidas para representar uma gama de valores potenciais sem influenciar indevidamente a direção da conversa.
  • Critérios de Moderação: Diretrizes claras de moderação foram estabelecidas para garantir a qualidade e relevância das contribuições dos participantes. Declarações odiosas, sem sentido, duplicadas, irrelevantes, mal formatadas ou tecnicamente inviáveis ​​foram removidas para manter a integridade do processo.

Analisando a Constituição de Fonte Pública

O processo de contribuição pública produziu uma rica tapeçaria de princípios gerados pelos participantes, que foram sintetizados em uma "constituição pública" coerente. Embora tenha havido uma sobreposição moderada de aproximadamente 50% com a constituição interna da Anthropic em termos de conceitos e valores essenciais, a constituição pública exibiu várias distinções notáveis:

  • Ênfase na objetividade e imparcialidade:A constituição pública deu forte ênfase à capacidade da IA ​​de fornecer informações equilibradas e objetivas, considerando múltiplas perspectivas sem preconceitos.
  • Foco na acessibilidade: Os participantes destacaram a importância da IA ​​ser acessível, adaptável e inclusiva para indivíduos com necessidades e habilidades diversas.
  • Promoção de comportamentos desejados:Em contraste com a constituição antrópica, que frequentemente se concentrava em desencorajar ações indesejadas, a constituição pública tendia a priorizar a promoção de comportamentos e qualidades positivas.
  • Princípios autogerados:A maioria dos princípios da constituição pública foram contribuições originais dos participantes, em vez de serem originados de publicações ou estruturas existentes.

Essas diferenças ressaltam o valor de incorporar diversas perspectivas públicas na formação dos fundamentos éticos dos sistemas de IA.

Treinamento e avaliação de um modelo alinhado com a contribuição do público

Para avaliar o impacto da constituição de origem pública, a Anthropic treinou duas variantes do seu modelo de IA, Claude - um usando a constituição pública (modelo Público) e outro usando sua constituição interna original (modelo Padrão). Esses modelos, junto com um modelo de controle, foram submetidos a uma avaliação rigorosa em múltiplas dimensões:

  • Compreensão da linguagem e habilidades matemáticas:Os modelos Público e Padrão demonstraram desempenho comparável em tarefas que avaliam a compreensão da linguagem (MMLU) e a resolução de problemas matemáticos (GSM8K), indicando que a escolha da constituição não impactou significativamente as principais capacidades dos modelos.
  • Utilidade e inocuidade: Avaliadores humanos interagiram com os modelos e classificaram o modelo público como igualmente útil e inofensivo em comparação ao modelo padrão, sugerindo que a constituição pública alinhou efetivamente o comportamento da IA ​​com as preferências humanas.
  • Avaliação de viés: Usando a estrutura BBQ (Bias Benchmark for QA), os pesquisadores descobriram que o modelo Público exibiu viés reduzido em nove categorias sociais em comparação ao modelo Padrão. Essa descoberta destaca o potencial da contribuição pública para mitigar o viés e promover a justiça em sistemas de IA.
  • Ideologia política:O benchmark OpinionQA revelou que tanto o modelo Público quanto o Padrão refletiam ideologias políticas semelhantes, indicando que a escolha da constituição não alterou substancialmente as inclinações políticas da IA.

Essas avaliações fornecem insights valiosos sobre a eficácia da IA ​​Constitucional no alinhamento de modelos de linguagem com valores e princípios determinados publicamente.

Lições Aprendidas

O processo de treinamento de um modelo de IA com base em informações públicas qualitativas apresentou um conjunto único de desafios e exigiu consideração cuidadosa em cada estágio:

Executando o processo de contribuição pública:

  • Seleção do Participante: Alcançar um equilíbrio entre representatividade e familiaridade com IA foi crucial para garantir contribuições significativas. O uso de critérios de triagem ajudou a mitigar confusão e declarações off-topic.
  • Escolha da plataforma: A seleção da plataforma Polis foi baseada em sua reputação de facilitar deliberações produtivas online e seus recursos colaborativos. No entanto, plataformas alternativas como All Our Ideas e Remesh também foram consideradas.
  • Declarações de sementes: Fornecer um conjunto diverso de declarações de exemplo ajudou a orientar os participantes e a obter contribuições úteis. Os pesquisadores visaram minimizar a influência dessas declarações de sementes no resultado final.
  • Critérios de moderação: Estabelecer diretrizes claras de moderação foi essencial para manter a qualidade e a relevância das contribuições dos participantes. No entanto, a aplicação desses critérios às vezes envolvia julgamentos subjetivos.

Desenvolvendo uma Constituição a partir de Contribuições Públicas:

  • Removendo declarações duplicadas: Para evitar ênfase excessiva em certas ideias e garantir uma representação equilibrada da opinião pública, declarações duplicadas foram removidas. Esta decisão envolveu pesar a dimensão social de representar fielmente as visões da maioria contra as restrições técnicas do treinamento de IA Constitucional.
  • Combinando ideias semelhantes: Para manter um comprimento e número administráveis ​​de valores distintos, declarações semelhantes foram combinadas em princípios mais abrangentes. Esse processo exigiu consideração cuidadosa para preservar a essência das contribuições originais.
  • Mapeando declarações públicas para os princípios da CAI AI: Os pesquisadores tiveram que traduzir as declarações públicas, que eram frequentemente enquadradas como afirmações gerais, para o formato específico exigido para o treinamento de IA Constitucional. Isso envolveu decisões subjetivas para equilibrar a fidelidade às declarações originais com a eficácia comprovada do formato de constituição existente.

Treinamento e avaliação do modelo:

  • Seleção de banco de dados rápida: A escolha do banco de dados de prompt usado para o treinamento de IA Constitucional teve um impacto significativo na relevância e eficácia dos modelos resultantes. Experimentos futuros devem considerar cuidadosamente o alinhamento entre o banco de dados de prompt e os princípios específicos da constituição.
  • Perda de peso: A ponderação apropriada de diferentes objetivos, como utilidade e inocuidade, durante o processo de treinamento foi crucial para evitar modelos que fossem excessivamente cautelosos ou inúteis. O refinamento iterativo com base em avaliações humanas foi necessário para atingir o equilíbrio certo.
  • Métricas de Avaliação: Selecionar métricas de avaliação apropriadas para capturar as nuances do alinhamento da IA ​​constitucional provou ser desafiador. Os pesquisadores reconheceram a necessidade de avaliações mais direcionadas, projetadas especificamente para avaliar a fidelidade dos modelos às suas constituições.
  • Complexidade do treinamento de IA constitucional: As complexidades técnicas do treinamento de IA Constitucional exigiram colaboração próxima entre os pesquisadores e os desenvolvedores originais. Isso destaca a necessidade de expertise interdisciplinar e compartilhamento de conhecimento para incorporar efetivamente a contribuição democrática em sistemas de IA.

Essas lições ressaltam a natureza multifacetada do alinhamento da IA ​​com os valores públicos e a importância de navegar cuidadosamente pelas considerações sociais, técnicas e éticas envolvidas.

Implicações e Caminhos Futuros

O experimento de IA constitucional conduzido pela Anthropic e pelo Collective Intelligence Project tem implicações profundas para o futuro do desenvolvimento e governança da IA:

  • Demonstrando a viabilidade do alinhamento de valores: O treinamento bem-sucedido de modelos de IA com base em uma constituição de fonte pública demonstra o potencial para alinhar modelos de linguagem avançados com valores e princípios determinados coletivamente. Isso abre novos caminhos para incorporar perspectivas diversas no desenvolvimento de sistemas de IA.
  • Melhorando a transparência e a responsabilidade: Ao tornar os princípios orientadores da IA ​​explícitos e sujeitos ao escrutínio público, a IA Constitucional promove transparência e responsabilidade na tomada de decisões de IA. Isso é particularmente crucial em domínios onde os sistemas de IA têm influência significativa sobre vidas humanas e resultados sociais.
  • Enfatizando a colaboração interdisciplinar: O experimento destaca a importância da colaboração entre desenvolvedores de IA, cientistas sociais e o público na formação dos fundamentos éticos da IA. Ele ressalta a necessidade de abordagens interdisciplinares que combinem expertise técnica com insights das ciências sociais e processos democráticos.

Olhando para o futuro, os pesquisadores pretendem desenvolver esse trabalho fundamental refinando suas metodologias, projetando avaliações mais direcionadas e explorando a escalabilidade e generalização da abordagem da Constitutional AI. Algumas possíveis direções futuras incluem:

  • Expandir o escopo do envolvimento público para incluir perspectivas mais diversas e globais.
  • Desenvolver estruturas padronizadas para traduzir contribuições públicas em princípios de IA acionáveis.
  • Investigando os efeitos de longo prazo da IA ​​Constitucional no comportamento e na tomada de decisões de sistemas de IA em contextos do mundo real.
  • Explorar o potencial de constituições personalizáveis ​​ou específicas de domínio para abordar os desafios éticos exclusivos de diferentes setores e aplicações.

À medida que o campo da IA ​​continua a evoluir em um ritmo sem precedentes, os insights obtidos com esse experimento, sem dúvida, moldarão a trajetória de futuros esforços de pesquisa e desenvolvimento.

Conclusão

O experimento Collective Constitutional AI da Anthropic e do Collective Intelligence Project é um marco seminal na democratização do desenvolvimento de IA. Ao envolver o público na criação de uma constituição de IA, esta pesquisa estabelece as bases para uma abordagem mais inclusiva, transparente e responsável para a governança de IA. As descobertas destacam o valor de perspectivas diversas e os desafios em alinhar modelos de linguagem avançados com valores sociais.

A IA constitucional surge como uma estrutura promissora para garantir que tecnologias de IA poderosas sirvam ao bem maior. Ao colocar os valores humanos no centro do desenvolvimento de IA, podemos aproveitar o potencial desses sistemas enquanto mitigamos riscos e consequências não intencionais.

No entanto, a jornada em direção a uma IA verdadeiramente democrática e alinhada a valores está longe de terminar. O experimento serve como um chamado para colaboração contínua, pesquisa e engajamento público na formação do futuro da IA. Por meio da sabedoria coletiva e da participação de diversas partes interessadas, podemos traçar um curso em direção a um futuro habilitado para IA que mantenha a transparência, a responsabilidade e o alinhamento com os valores humanos.

Os insights deste experimento inovador informarão e inspirarão futuros empreendimentos no campo. Ao construir sobre a fundação estabelecida pela Anthropic e pelo Collective Intelligence Project, podemos trabalhar em direção a um futuro onde os sistemas de IA são tecnologicamente avançados, eticamente fundamentados e socialmente responsáveis. O caminho à frente pode ser desafiador, mas as recompensas potenciais - um mundo onde a IA e a humanidade trabalham em harmonia - valem o esforço.

Você pode experimentar o mais novo AI Anthropic Claude gratuitamente no Latenode

Perguntas frequentes

O que diferencia a IA Constitucional de outras abordagens de alinhamento de IA? 

A Constitutional AI se distingue por focar em incorporar valores e princípios de alto nível diretamente no processo de treinamento do sistema de IA. Em vez de depender somente de restrições ou supervisão externas, a Constitutional AI visa criar sistemas de IA que se alinhem inerentemente com normas e expectativas sociais.

Como os participantes foram selecionados para o processo de contribuição pública? 

Os pesquisadores colaboraram com a empresa de pesquisa PureSpectrum para recrutar uma amostra representativa de aproximadamente 1,000 adultos dos EUA. O processo de seleção considerou fatores demográficos como idade, gênero, renda e geografia para garantir um grupo de participantes diverso e inclusivo. Além disso, critérios de triagem foram empregados para avaliar a familiaridade dos participantes com os conceitos de IA.

Por que a plataforma Polis foi escolhida para o processo de contribuição pública? 

A plataforma Polis foi selecionada devido ao seu histórico comprovado em facilitar deliberação produtiva online e construção de consenso. Seus recursos colaborativos, que permitem que os participantes se envolvam com as ideias uns dos outros e desenvolvam sobre elas, foram bem adequados aos objetivos do experimento Constitutional AI. Os pesquisadores também tinham experiência anterior trabalhando com a equipe Polis, o que facilitou uma implementação mais cuidadosa e eficaz do processo de contribuição pública.

Como os pesquisadores garantiram a qualidade e a relevância das contribuições dos participantes? 

Para manter a integridade do processo de contribuição pública, os pesquisadores estabeleceram critérios claros de moderação. Declarações que foram consideradas odiosas, sem sentido, duplicadas, irrelevantes, mal formatadas ou tecnicamente inviáveis ​​foram removidas. Esse processo de moderação envolveu uma combinação de diretrizes predefinidas e julgamentos subjetivos pela equipe de pesquisa.

Quais foram as principais diferenças entre a constituição pública e a constituição original da Anthropic? 

Embora houvesse uma sobreposição moderada de cerca de 50% entre a constituição pública e a constituição interna da Anthropic em termos de conceitos e valores essenciais, a constituição pública exibiu algumas distinções notáveis. Ela colocou uma ênfase mais forte na objetividade, imparcialidade e acessibilidade, e tendeu a priorizar a promoção de comportamentos desejados em vez do desencorajamento de comportamentos indesejados. Além disso, a maioria dos princípios na constituição pública foram contribuições originais dos participantes, em vez de serem originados de publicações ou estruturas existentes.

Como os modelos treinados na constituição pública se saíram em comparação com aqueles treinados na constituição original do Anthropic? 

Os modelos treinados na constituição pública (modelos públicos) demonstraram desempenho comparável aos treinados na constituição da Anthropic (modelos padrão) em termos de compreensão da linguagem e utilidade percebida. No entanto, os modelos públicos exibiram viés reduzido em várias dimensões sociais, conforme medido pela estrutura BBQ (Bias Benchmark for QA). Essa descoberta sugere que incorporar a contribuição pública pode potencialmente mitigar o viés e promover a justiça em sistemas de IA.

Quais desafios os pesquisadores enfrentaram ao incorporar contribuições democráticas no processo de desenvolvimento de IA? 

O processo de treinamento de um modelo de IA com base em contribuição pública qualitativa apresentou vários desafios. Estes incluíam garantir a seleção representativa de participantes, moderação efetiva de contribuições e equilibrar a representação fiel da opinião pública com as restrições técnicas do treinamento de IA Constitucional. Os pesquisadores também tiveram que navegar pela complexidade de traduzir declarações públicas em princípios de IA acionáveis ​​e selecionar métricas de avaliação apropriadas para avaliar o alinhamento dos modelos resultantes com suas constituições.

Como os insights deste experimento podem informar pesquisas e desenvolvimentos futuros em governança de IA? 

O experimento Constitutional AI conduzido pela Anthropic e pelo Collective Intelligence Project tem implicações significativas para o futuro da governança da IA. Ele demonstra a viabilidade de alinhar modelos de linguagem avançados com valores e princípios determinados coletivamente, destacando o potencial para incorporar diversas perspectivas no desenvolvimento da IA. O experimento também enfatiza a importância da colaboração interdisciplinar entre desenvolvedores de IA, cientistas sociais e o público na formação dos fundamentos éticos da IA. Pesquisas futuras podem se basear nesses insights explorando a escalabilidade e generalização da abordagem Constitutional AI, desenvolvendo estruturas padronizadas para traduzir contribuições públicas em princípios de IA e investigando os efeitos de longo prazo de sistemas de IA alinhados a valores em contextos do mundo real.

Aplicação UmAplicação Dois

Tente agora

Blogs relacionados

Caso de uso

Apoiado por