Pamiętacie demo głosowe dla GPT-4o z OpenAI sprzed kilku miesięcy, które wstrząsnęło światem swoim podobieństwem do człowieka? Wiecie, takie, które mogło sprawić, że na chwilę zapomnieliście, że rozmawiacie z AI, a nawet przypominało wielu osobom postać AI Scarlett Johansson z filmu Her (i również spotkało się z krytyką za to samo).
OpenAI w końcu zaczyna udostępniać go w wersji Alpha niewielkiej liczbie użytkowników ChatGPT Plus, jak poinformowała firma na X. Początkowo firma planowała rozpocząć udostępnianie w czerwcu, ale zostało to opóźnione ze względów bezpieczeństwa i w celu upewnienia się, że „osiągnie poziom [OpenAI], aby uruchomić”. W związku z tym firma była zajęta ulepszaniem modelu z zespołem zewnętrznych red teamerów, aby mógł wykrywać i odrzucać określone treści.
Zaczynamy udostępniać zaawansowany tryb głosowy niewielkiej grupie użytkowników ChatGPT Plus. Zaawansowany tryb głosowy oferuje bardziej naturalne rozmowy w czasie rzeczywistym, pozwala na przerwanie w dowolnym momencie oraz wyczuwa i reaguje na Twoje emocje. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 lipca 2024 r
Teraz niektórzy płacący użytkownicy zaczynają uzyskiwać dostęp do modelu w swojej aplikacji ChatGPT, ale na razie dostęp do wersji alfa pozostanie niewielki. Firma twierdzi, że planuje stopniowo udostępniać dostęp większej liczbie użytkowników i udostępnić go wszystkim płacącym użytkownikom jesienią.
Wygląda na to, że nie ma sposobu, aby poprosić o dostęp do Advanced Voice Mode. Jeśli jesteś na liście niewielkiej liczby użytkowników, którzy uzyskają dostęp do wersji alfa, otrzymasz e-mail z instrukcjami, a także powiadomienie w aplikacji ChatGPT o możliwości wypróbowania Voice Mode.
Advanced Voice Mode będzie mógł mówić tylko czterema wstępnie ustawionymi głosami – Juniper, Amber, Cove i Breeze. Warto zauważyć, że OpenAI usunęło Sky – tę, która brzmiała jak Scarlett Johansson wkrótce po wydaniu dema na wydarzeniu Spring, a aktor wysłał listy do firmy z pytaniem, jak powstał głos (na co OpenAI najwyraźniej nigdy nie odpowiedziało). Wygląda na to, że Sky nadal nie jest częścią listy.
ChatGPT-4o nie będzie również w stanie zapewnić wyników w żadnym innym głosie poza tymi w ustawieniach wstępnych, aby chronić prywatność użytkownika. Istnieją również zabezpieczenia blokujące żądania dotyczące treści brutalnych lub chronionych prawem autorskim.
Jeśli masz dostęp do zaawansowanego trybu głosowego w aplikacji ChatGPT, wypróbuj go. Chociaż nie będzie w stanie zrobić wszystkiego, co pokazano w demach, dopóki nie uzyska również możliwości widzenia, nadal wydaje się imponujący, zgodnie z niektórymi filmami udostępnionymi przez użytkowników, którzy mają dostęp.
Dodaj komentarz