Meta wydaje Llama 3.1: najpotężniejszy jak dotąd model AI typu open source

Meta ogłosiła wydanie Llama 3.1, swojego najnowszego i najbardziej zaawansowanego modelu sztucznej inteligencji typu open source. Ta nowa wersja stanowi znaczący krok naprzód w technologii AI, a Meta twierdzi, że przewyższa ona wiodące zastrzeżone modele firm takich jak OpenAI.

Flagowy model Llama 3.1 405B, zawierający 405 miliardów parametrów, jest obecnie największym publicznie dostępnym modelem bazowym. Demonstruje najnowocześniejsze możliwości w zakresie wiedzy ogólnej, matematyki, korzystania z narzędzi i tłumaczeń wielojęzycznych. Model został wytrenowany na ponad 15 bilionach tokenów przy użyciu ponad 16 000 procesorów graficznych H100 firmy Nvidia.

Jedną z kluczowych ulepszeń w Llama 3.1 jest rozszerzona długość kontekstu do 128 tys. tokenów, co stanowi 16-krotność pojemności poprzednich modeli Llama. Pozwala to AI przetwarzać i rozumieć znacznie dłuższe fragmenty tekstu, zwiększając jej zdolność do obsługi złożonych zadań i generowania bardziej niuansowych odpowiedzi.

Nowy model obsługuje osiem języków: angielski, niemiecki, francuski, włoski, portugalski, hindi, hiszpański i tajski. Ta wielojęzyczna funkcjonalność sprawia, że Llama 3.1 jest wszechstronnym narzędziem dla deweloperów i firm pracujących nad globalnymi aplikacjami AI.

Meta wypuszcza Llama 3.1 w trzech rozmiarach: 405B , 70B i 8B parametrów. Każdy rozmiar jest zoptymalizowany dla różnych przypadków użycia:

Model 405B idealnie nadaje się do zastosowań korporacyjnych i zaawansowanych badań, umożliwia generowanie długich tekstów, tłumaczenia wielojęzyczne, kodowanie i wykonywanie złożonych zadań rozumowania.
Model 70B nadaje się do tworzenia treści, sztucznej inteligencji konwersacyjnej i rozumienia języka.
Model 8B jest przeznaczony do zastosowań o ograniczonych zasobach obliczeniowych, takich jak urządzenia mobilne.

Aby ułatwić adopcję, Meta współpracuje z dużymi firmami technologicznymi, takimi jak Amazon, Google i Databricks, aby udostępnić Llama 3.1 na różnych platformach. Na przykład modele są teraz dostępne w Amazon Web Services (AWS) za pośrednictwem usług takich jak Amazon SageMaker JumpStart i Amazon Bedrock.

Mark Zuckerberg, CEO Meta, podkreśla znaczenie otwartego kodu AI, stwierdzając, że jest to klucz do demokratyzacji korzyści AI. Uważa, że modele otwartego kodu, takie jak Llama 3.1, ostatecznie przewyższą te zastrzeżone pod względem możliwości i wskaźników adopcji.

Wydanie Llama 3.1 zawiera również zaktualizowaną licencję, która pozwala deweloperom na wykorzystanie wyników modelu do ulepszania innych systemów AI. Oczekuje się, że ten ruch przyspieszy innowacje w dziedzinie AI i zapewni deweloperom większą elastyczność w budowaniu i dostosowywaniu aplikacji AI.

Zaangażowanie Meta w open-source AI przypomina sposób, w jaki Linux stał się dominującym systemem operacyjnym open-source dla wielu urządzeń i serwerów. Firma ma nadzieję, że Llama 3.1 stanie się kamieniem węgielnym dla rozwoju AI.

Ponieważ AI nadal szybko ewoluuje, wydanie Llama 3.1 stanowi znaczący kamień milowy w uczynieniu potężnych modeli AI bardziej dostępnymi dla deweloperów i firm na całym świecie. Przygotowuje grunt pod nową erę innowacji AI, w której modele open source bezpośrednio konkurują ze swoimi zastrzeżonymi odpowiednikami, a potencjalnie je przewyższają.