Google I/O 2024

i

Autor: Google

Google

Google I/O 2024 – 7 najważniejszych zapowiedzi związanych ze sztuczną inteligencją

2024-05-15 8:28

Motywem przewodnim Google I/O 2024 był festyn Gemini, a całe wydarzenie dotyczyło sztucznej inteligencji. Od zaprezentowania futurystycznego asystenta AI o nazwie „Projekt Astra”, po dodanie Gemini do niemal każdej usługi lub produktu oferowanego przez firmę. Oto 7 najważniejszych zapowiedzi podczas Google I/O 2024.

Spis treści

  1. Google Projekt Astra
  2. „Zapytaj zdjęcia” od Gemini
  3. Google rozwiąże wasze prace domowe
  4. Szukanie w Google za pomocą filmu
  5. Konwersja tekstu na wideo z Veo
  6. Android z mnóstwem możliwości Gemini
  7. Google Workspace stanie się dużo mądrzejsze

Google Projekt Astra

Google rzeczywiście miało odpowiedź na GPT-4o OpenAI i CoPilot Microsoftu. Projekt Astra, nazywany „agentem sztucznej inteligencji”, to w zasadzie Obiektyw Google na sterydach, który wygląda naprawdę imponująco, potrafi rozumieć, rozumować i reagować na wideo, czy dźwięk w czasie rzeczywistym. Na nagranym filmie pokazanym na telefonie Pixel użytkownik chodził po biurze, transmitował na żywo obraz z tylnej kamery i zadawał Astrze pytania. Gemini oglądał i rozumiał elementy wizualne, jednocześnie zadając pytania. Podczas demonstracji AI potrafiło nawet zidentyfikować dzielnicę w Londynie.

Czytaj też: Google Maps otrzymało 2 kluczowe innowacje! Ułatwią nasze życie. Firma spogląda w przyszłość

„Zapytaj zdjęcia” od Gemini

Czy kiedykolwiek chciałeś szybko znaleźć konkretne zdjęcie, które zrobiłeś w odległej przeszłości? Teraz Google urzeczywistnia te życzenia dzięki dużej aktualizacji Zdjęć Google, która łączy je z Gemini. Daje mu to dostęp do Twojej biblioteki, umożliwia jej przeszukiwanie i łatwe dostarczanie wyników, których szukasz. Podczas demonstracji na scenie Sundar Pichai ujawnił, że możesz poprosić o tablicę rejestracyjną, a firma Photos dostarczy obraz przedstawiający tablicę rejestracyjną oraz cyfry/znaki tworzące tablicę.

Google rozwiąże wasze prace domowe

NotebookLM ma teraz dostęp do Gemini 1.5 Pro i, jak wynika z wersji demonstracyjnej przedstawionej na konferencji I/O 2024, będzie teraz lepszym nauczycielem niż kiedykolwiek wcześniej. Demo pokazało, jak Josh Woodward z Google za jednym naciśnięciem przycisku był w stanie stworzyć szczegółowy przewodnik edukacyjny zawierający dalsze wyniki, w tym quizy i często zadawane pytania, wszystkie zaczerpnięte z materiałów źródłowych. Nowa funkcja umożliwiała wyświetlenie całej zawartości w formacie audio, tworząc zasadniczo dyskusję w stylu podcastu. Co więcej, w nagraniu uczestniczył więcej niż jeden mówca, rozmawiający na dany temat w naturalny sposób, który z pewnością byłby bardziej pomocny niż sfrustrowany rodzic próbujący odgrywać rolę nauczyciela.

Szukanie w Google za pomocą filmu

Google zaprezentowało nową sztuczkę, w które będziesz mógł nagrać film i przeszukać go, aby uzyskać wyniki w przeglądarce. Prezentacja polegała na nagraniu danej rzeczy, jednocześnie zadając pytania. Google dostarczył odpowiedź w formie tekstowej. Mówiąc najprościej, Google intensywnie wykorzystuje generatywną sztuczną inteligencję w wyszukiwaniu, zarówno pod kątem wyników, jak i różnych sposobów ich uzyskiwania.

Konwersja tekstu na wideo z Veo

Veo może generować minutowe filmy w jakości 1080p, a wszystko to za pomocą prostego polecenia. Ten monit może obejmować efekty kinowe, takie jak prośba o wykonanie zdjęcia poklatkowego lub zdjęcia z lotu ptaka, a wczesne próbki wyglądają imponująco. Nie musisz też zaczynać od zera – prześlij wideo wejściowe za pomocą polecenia, a Veo może edytować klip zgodnie z Twoimi żądaniami. Istnieje również możliwość dodawania masek i modyfikowania określonych części wideo.

Android z mnóstwem możliwości Gemini

Gemini od teraz jest integrowane z rdzeniem Androida, aby integrować się z Twoim przepływem informacji. Jak pokazano, Gemini może teraz przeglądać, czytać i rozumieć zawartość ekranu Twojego telefonu, pozwalając mu przewidywać pytania dotyczące tego, co przeglądasz. Dzięki temu może poznać kontekst oglądanego filmu, przewidzieć prośbę o podsumowanie podczas przeglądania obszernego pliku PDF lub przygotować się na niezliczone pytania dotyczące aplikacji, w której się znajdujesz.

Google Workspace stanie się dużo mądrzejsze

W Gmail, dzięki nowemu panelowi bocznemu po lewej stronie, możesz poprosić Gemini o podsumowanie wszystkich ostatnich rozmów ze współpracownikiem. Wynik jest następnie podsumowywany w punktach, podkreślających najważniejsze aspekty. Google Meet może przekazać Ci najważniejsze momenty spotkania lub pytania, o które mogą pytać inne osoby biorące udział w rozmowie. W Arkuszach Google Gemini pomoże nam w zrozumieniu danych i przetwarzaniu żądań, takich jak pobieranie określonej sumy lub zbioru danych. Najbardziej futurystycznym przykładem może być wirtualny członek drużyny „Chip”. Może działać na czacie G i być wywoływany w celu wykonania różnych zadań lub zapytań.

Technologiczny Przegląd Tygodnia - odc. 6

Pasujesz bardziej do świata Wiedźmina, czy Cyberpunka 2077? Ten QUIZ to sprawdzi!

Pytanie 1 z 9
W jakim miejscu mieszkasz?