GPT-4o, najnowszy flagowy model OpenAI, spotkał się z mieszanymi uczuciami użytkowników. Podczas gdy niektórzy są pod wrażeniem jego szybkości i możliwości multimodalnych, inni są rozczarowani faktem, że nie wykazuje on żadnej poprawy w zakresie inteligencji i rozumowania w porównaniu z GPT-4. Ale niezależnie od tego, czy jesteś „zachwycony” zespołem, czy też „meh”, nadal trudno zignorować fakt, że multimodalne możliwości GPT-4o zmieniają zasady gry.
Oto kilka sposobów, w jakie GPT-4o będzie mógł Ci pomóc po udostępnieniu przez OpenAI nowych funkcji głosowych i wizyjnych.
Partner w nauce/tutor
Dzięki możliwościom GPT-40 może być idealnym partnerem do nauki lub nauczycielem. Możesz go używać do nauki języków lub uzyskania pomocy w rozwiązywaniu problemów matematycznych. Możesz wskazywać obiekty, aby uzyskać pomoc w nauce języka lub dzielić się z nimi pytaniami matematycznymi. Nie tylko przekaże Ci odpowiedzi lub odrobi za Ciebie pracę domową.
https://www.youtube.com/watch?v=_nSmkyDNulk
Może utworzyć serię pytań, które pomogą Ci zrozumieć koncepcję i samodzielnie przejść do części dotyczącej rozwiązywania problemu, jak prawdziwy nauczyciel. Co więcej, dzięki swoim zaawansowanym możliwościom jest w stanie poradzić sobie z sytuacją „empatycznie”. Tak więc, udzielając Ci korepetycji, może wykazać się niesamowitą cierpliwością i empatią, popychając Cię we właściwym kierunku, nie popadając w frustrację. Dla wielu osób może to być czasami dość trudne do osiągnięcia w prawdziwym życiu.
Dalsze zastosowania są jeszcze bardziej intrygujące, jeśli można zastosować GPT-4o w inteligentnych okularach (czerpiąc pomysł z projektu Google Astra), aby zawsze mieć przy sobie partnera do nauki.
Uzyskaj pomoc w przygotowaniu do rozmowy kwalifikacyjnej
ChatGPT, zasilany przez GPT-4o, może być najlepszym partnerem w przygotowaniach do rozmów kwalifikacyjnych. Chociaż można już symulować rozmowę z ChatGPT w celu przygotowania się do rozmowy kwalifikacyjnej i może to pomóc w fantastycznym opanowaniu technicznych aspektów rozmowy, proces ten nie był tak naturalny ze względu na czynniki takie jak opóźnienie i brak multimodalności w rdzeniu ChatGPT.
Jednak dzięki ulepszonym możliwościom rozumowania za pomocą głosu i obrazu może pójść o krok dalej i pomóc Ci. Na początek, dzięki nowej możliwości „zobaczenia” Ciebie, może nawet poprowadzić Cię w estetycznej części przygotowań do rozmowy kwalifikacyjnej, np. w kwestii stroju.
https://www.youtube.com/watch?v=wfAYBdaGVxs
Jednak implikacje są o wiele bardziej dotkliwe. Dzięki swoim możliwościom wizualnym i zdolności interpretowania ludzkich emocji może nawet dostarczyć Ci informacji zwrotnych na temat mowy ciała, podobnie jak prawdziwy trener.
Asystent spotkania
ChatGPT może przyłączać się do Twoich spotkań, podsłuchiwać rozmowy, transkrybować, podsumowywać, a nawet prezentować swoje opinie, a wszystko to w czasie rzeczywistym, jak prawdziwy asystent.
Możesz zapytać o to, co było omawiane podczas rozmowy, co każda osoba sądzi na temat określonego punktu widzenia, zidentyfikować sprzeczne punkty widzenia, popracować nad problemami związanymi z analizą danych, wyszukać określone informacje i wiele więcej.
Tłumacz języka osobistego
GPT-4o może być doskonałym asystentem tłumaczącym język. Może tłumaczyć rozmowę w czasie rzeczywistym, bez konieczności wielokrotnego jej powtarzania. Możesz więc prowadzić normalną rozmowę w różnych językach i za każdym razem, gdy mówca skończy mówić, ChatGPT przetłumaczy ją na drugi język.
Czym różni się to od korzystania z Tłumacza Google lub innego narzędzia tłumaczeniowego? Oprócz tego, że nie trzeba za każdym razem włączać tłumaczenia i dzięki temu rozmowa jest naturalna, zdolność GPT-4o do rozumienia intonacji słów oznacza, że mniej traci się w tłumaczeniu.
Asystent dostępności dla niewidomych
ChatGPT-4o, dzięki swoim możliwościom wizyjnym, może pomóc osobom niedowidzącym, przyglądając się Twojemu otoczeniu i opisując Ci to wszystko.
https://www.youtube.com/watch?v=KwNUJ69RbwY
Choć w obecnym stanie wydaje się to raczej aspiracyjne, wyobraźcie sobie konsekwencje, gdyby można było zastosować GPT-4o w inteligentnych okularach, takich jak okulary Meta Rayban, gdzie GPT-4o mógłby dosłownie być oczami osoby niedowidzącej. Nawet w obecnej formie zadziwiające jest to, że ludzie mogą skierować aparat w telefonie na coś, a on może uchwycić wszystkie szczegóły.
Jeśli ChatGPT byłby w stanie interpretować język migowy, mógłby w przyszłości pomagać nawet osobom niesłyszącym.
Możliwości monitorowania
ChatGPT-4o może być „potencjalnie” używany do monitorowania dzieci, zwierząt domowych, chorych i starszych, a nawet po prostu takich rzeczy, jak drzwi wejściowe itp. Wyobraź sobie, że musisz na chwilę odejść i chcesz, aby ktoś monitorował Twoje dziecko lub zwierzę i natychmiast Cię ostrzega, jeśli angażuje się w niebezpieczne działania (które możesz zdefiniować).
Chociaż minie trochę czasu, zanim będzie można zaufać sztucznej inteligencji, że nie popełnia błędów i nie zapewnia za każdym razem wiarygodnych wyników, z pewnością jest to ekscytujący możliwy przypadek użycia w przyszłości.
Asystent kodowania
Dzięki możliwości dostępu ChatGPT do Twojego ekranu poprzez udostępnianie ekranu, możesz mieć przy sobie asystenta kodowania, który będzie Cię prowadził przez cały proces. Chociaż będzie to przydatne także w przypadku innych aplikacji, dzięki ulepszonym możliwościom kodowania GPT-4o, uzyskanie pomocy w kodowaniu będzie najlepszą aplikacją.
Analiza danych
GPT-4o zapewnia niesamowitą poprawę szybkości w porównaniu z GPT-4 Turbo i zapewnia tę prędkość również w analizie danych. Może przetwarzać arkusze kalkulacyjne, analizować dane, a nawet tworzyć diagramy statystyczne, wykresy i wykresy w mniej niż 3o sekund.
Tworzenie modeli 3D
GPT-4o może nawet tworzyć pliki STL dla modeli 3D z pojedynczych podpowiedzi tekstowych, przyspieszając proces wizualizacji i prototypowania. Niezależnie od tego, czy chcesz przyspieszyć swój przepływ pracy, czy też nie masz wiedzy technicznej wymaganej do wykonania tego zadania, ChatGPT może Ci pomóc!
Użyłem GPT-4o, aby utworzyć plik STL dla modelu 3D na moim telefonie w ~ 20 sekund. Całkiem niezwykłe, co możesz teraz wygenerować za pomocą sztucznej inteligencji i prostego podpowiedzi. pic.twitter.com/2fbObrpPol
— Min Choi (@minchoi) 14 maja 2024 r
Tworzenie spójnych postaci
OpenAI jakiś czas temu wprowadziło możliwości generowania obrazów DALL-E do ChatGPT. Ale dzięki GPT-4o możesz tworzyć wiele obrazów tego samego znaku, zachowując jednocześnie spójność znaków. Możesz więc teraz używać ChatGPT do tworzenia spójnych postaci w swoich historiach i tworzenia ich obrazów w różnych akcjach.
Transkrypcja odręcznych notatek
Dzięki zwiększonym możliwościom rozpoznawania obrazów GPT-4o może teraz lepiej transkrybować odręczne notatki. Można go używać do digitalizacji notatek szkolnych lub uniwersyteckich. Wykazuje nawet niesamowite możliwości transkrypcji podczas obsługi odręcznych listów z XVIII wieku. Tak więc, mimo że wystąpią błędy, przyspieszy to wykładniczo cały proces!
GPT-4o jest naprawdę niezwykły pod względem pisma 18-tego. Dałem mu następujący list i poprosiłem o transkrypcję. Kilka bardzo drobnych błędów… niesamowite! pic.twitter.com/3JevZvd5p5
— Historia generatywna (@HistoryGPT) 14 maja 2024 r
Chociaż GPT-4o nie jest ogromnym ulepszeniem w stosunku do GPT-4 pod względem inteligencji i rozumowania, nie jest to również w żadnym wypadku małe ulepszenie. Nawet jeśli bardziej przeraża Cię jego antropomorfizm lub podobieństwa do sztucznej inteligencji Scarlett Johannsen w Her, nie możesz zaprzeczyć, że fakt, że stała się ona bardziej inteligentna, będzie pomocny w praktyce.
Jednakże jest jeszcze jeden fakt, którego nie można przeoczyć rozważając praktyczne zastosowania GPT-4o – okno kontekstowe ChatGPT 128K. Przy ograniczonym oknie kontekstowym ChatGPT może być przydatny tylko w scenariuszach takich jak bycie asystentem spotkania, tłumaczem języka. Pytanie, jak długo po spotkaniu/rozmowie zakończy się okno kontekstowe ChatGPT, jest niezwykle istotne. Istnieje również kwestia ograniczonych ograniczeń użycia dla GPT-4o.
Dodaj komentarz