Breadcrumb navigation

NEC desenvolve LLM leve com proficiência em japonês de classe mundial e apenas 13 bilhões de parâmetros

A NEC Corporation (NEC; TSE: 6701) desenvolveu seu próprio IA generativo em Large Language Model (LLM) para o idioma japonês. O LLM é um modelo de uso geral, também conhecido como modelo de fundação, desenvolvido pela NEC usando dados multilíngues que a empresa coletou e processou de forma independente. Este recurso, que alcança alto desempenho enquanto reduz o número de parâmetros para 13 bilhões por meio de inovações exclusivas, não apenas economiza o consumo de energia, mas também permite a operação em ambientes de nuvem e locais devido ao seu peso leve e alta velocidade. Em termos de desempenho, o LLM alcançou proficiência em língua japonesa de classe mundial em uma referência do idioma que mede conhecimento e compreensão de leitura, equivalente à capacidade de raciocínio do modelo.

A NEC já começou a usar este LLM para operações internas, aplicando-o não apenas para operações comuns, mas também para melhorar a eficiência de várias tarefas, como criação de documentos e suporte à codificação.

Nos últimos anos, a IA generativa, como o ChatGPT, atraiu a atenção mundial e seu uso está aumentando rapidamente em uma ampla gama de setores. No entanto, a maioria dos LLMs existentes é treinada principalmente em inglês e quase não há LLMs que possam ser personalizados para uso em uma variedade de indústrias, embora possuam alta habilidade no idioma japonês.

Espera-se que o desenvolvimento deste novo LLM pela NEC acelere ainda mais seu uso comercial e ajude a melhorar a produtividade corporativa.

Recursos LLM da NEC

1 . Alta proficiência em língua japonesa

Para usar o LLM em negócios reais é necessário alto desempenho em termos de conhecimento e compreensão da língua japonesa. A NEC avaliou seu LLM usando o JGLUE, um benchmark de compreensão da língua japonesa, que representa um padrão no campo de processamento de linguagem natural*. Descobriu-se que ele alcança uma classe superior, com 81,1% de capacidade para responder  perguntas, o que equivale à quantidade de conhecimento da língua japonesa. Na compreensão da leitura de documentos, que corresponde à sua capacidade de raciocínio, o índice de 84,3% alcançado supera o do principal concorrente. Como resultado, espera-se que o LLM da NEC tenha um bom desempenho em vários setores.

  1. Light weight

Este LLM tem alto desempenho, mas a tecnologia proprietária da NEC reduziu o tamanho do modelo para um compacto de 13 bilhões de parâmetros. Enquanto os LLMs convencionais, com alto desempenho, requerem um grande número de GPUs, este LLM pode ser executado em um servidor padrão com uma única GPU. Como resultado, os aplicativos de negócios que incorporam o LLM podem responder bem, o que ajuda a reduzir o consumo de energia e os custos do servidor durante as operações de negócios. Além disso, o LLM pode ser facilmente construído em um curto período de tempo e executado no ambiente local do cliente, tornando-o seguro mesmo para operações altamente confidenciais.

O tamanho do parâmetro é frequentemente usado para medir o desempenho de um LLM. No entanto, aumentar o tamanho do parâmetro leva a uma diminuição na velocidade de inferência, bem como a um aumento no número de GPUs e no consumo de energia necessário para operar o modelo. Consequentemente, se o mesmo desempenho puder ser fornecido, é desejável ter menos parâmetros. Neste estudo, a NEC se concentrou no fato de que o desempenho do LLM depende não apenas do tamanho do parâmetro, mas também da quantidade de dados de alta qualidade e de tempo usados para treinamento. Como resultado, a NEC alcançou alto desempenho, limitando o tamanho do parâmetro ao intervalo que pode ser operado com uma única GPU e usando uma grande quantidade de dados e tempo de cálculo.

A NEC desenvolveu de forma independente o maior supercomputador para pesquisa de IA entre as empresas japonesas e está totalmente operacional desde março de 2023. Ao utilizar este supercomputador, a NEC conseguiu construir um LLM de 13 bilhões de parâmetros de alto desempenho em um período de aproximadamente um mês.

No futuro, a NEC pretende alavancar o modelo de fundação para promover ativamente o desenvolvimento de LLM para empresas individuais, usando dados fechados de clientes. A empresa também planeja melhorar o desempenho do próprio modelo de fundação e colocar essas tecnologias em uso prático o mais rápido possível por meio do NEC Generative AI Hub.

Observação:
Nos benchmarks, o ajuste fino (supervisão) não foi realizado nos dados de treinamento e apenas alguns exemplos são fornecidos para LLMs em uma configuração de aprendizado de contexto. Um conjunto de dados JCommonSenseQA foi usado para avaliar o nível de conhecimento dos LLMs em questões de senso comum, e três exemplos foram usados para aprendizado no contexto. Um conjunto de dados JSQuAD foi usado para avaliar o desempenho da habilidade de compreensão de leitura e dois exemplos foram usados para aprendizado no contexto. Uma pontuação de correspondência exata é usada para métricas de avaliação. "LLM C (japonês)" indica o modelo de melhor desempenho entre os LLMs japoneses, cujas pontuações de avaliação são obtidas de experimentos conduzidos pela NEC ou obtidas do artigo original.

Resultados da avaliação por JGLUE, uma referência de compreensão da língua japonesa (pesquisa NEC).

Sobre a NEC Corporation

A NEC Corporation estabeleceu-se como líder na integração de TI e tecnologias de rede, ao mesmo tempo em que promove a declaração de marca "Orchestrating a brighter world". A NEC permite que empresas e comunidades se adaptem às rápidas mudanças que ocorrem tanto na sociedade quanto no mercado, pois fornece os valores sociais de segurança, proteção, equidade e eficiência para promover um mundo mais sustentável, onde todos têm a chance de atingir todo o seu potencial. Para obter mais informações, visite a NEC em http://www.nec.com


***

Assessoria de imprensa da NEC:

A4&Holofote Comunicação

Marília Pontes – mariliapontes@a4eholofote.com.com.br

Telefone: +55-11-3897-4127 | 11 9 9930-4862

Marcos Vinícius Dantas – marcosvinicius@a4eholofote.com.br

Telefone: +5-11 9 9930-4862