Spis treści
- Google Projekt Astra
- „Zapytaj zdjęcia” od Gemini
- Google rozwiąże wasze prace domowe
- Szukanie w Google za pomocą filmu
- Konwersja tekstu na wideo z Veo
- Android z mnóstwem możliwości Gemini
- Google Workspace stanie się dużo mądrzejsze
Google Projekt Astra
Google rzeczywiście miało odpowiedź na GPT-4o OpenAI i CoPilot Microsoftu. Projekt Astra, nazywany „agentem sztucznej inteligencji”, to w zasadzie Obiektyw Google na sterydach, który wygląda naprawdę imponująco, potrafi rozumieć, rozumować i reagować na wideo, czy dźwięk w czasie rzeczywistym. Na nagranym filmie pokazanym na telefonie Pixel użytkownik chodził po biurze, transmitował na żywo obraz z tylnej kamery i zadawał Astrze pytania. Gemini oglądał i rozumiał elementy wizualne, jednocześnie zadając pytania. Podczas demonstracji AI potrafiło nawet zidentyfikować dzielnicę w Londynie.
Czytaj też: Google Maps otrzymało 2 kluczowe innowacje! Ułatwią nasze życie. Firma spogląda w przyszłość
„Zapytaj zdjęcia” od Gemini
Czy kiedykolwiek chciałeś szybko znaleźć konkretne zdjęcie, które zrobiłeś w odległej przeszłości? Teraz Google urzeczywistnia te życzenia dzięki dużej aktualizacji Zdjęć Google, która łączy je z Gemini. Daje mu to dostęp do Twojej biblioteki, umożliwia jej przeszukiwanie i łatwe dostarczanie wyników, których szukasz. Podczas demonstracji na scenie Sundar Pichai ujawnił, że możesz poprosić o tablicę rejestracyjną, a firma Photos dostarczy obraz przedstawiający tablicę rejestracyjną oraz cyfry/znaki tworzące tablicę.
Google rozwiąże wasze prace domowe
NotebookLM ma teraz dostęp do Gemini 1.5 Pro i, jak wynika z wersji demonstracyjnej przedstawionej na konferencji I/O 2024, będzie teraz lepszym nauczycielem niż kiedykolwiek wcześniej. Demo pokazało, jak Josh Woodward z Google za jednym naciśnięciem przycisku był w stanie stworzyć szczegółowy przewodnik edukacyjny zawierający dalsze wyniki, w tym quizy i często zadawane pytania, wszystkie zaczerpnięte z materiałów źródłowych. Nowa funkcja umożliwiała wyświetlenie całej zawartości w formacie audio, tworząc zasadniczo dyskusję w stylu podcastu. Co więcej, w nagraniu uczestniczył więcej niż jeden mówca, rozmawiający na dany temat w naturalny sposób, który z pewnością byłby bardziej pomocny niż sfrustrowany rodzic próbujący odgrywać rolę nauczyciela.
Szukanie w Google za pomocą filmu
Google zaprezentowało nową sztuczkę, w które będziesz mógł nagrać film i przeszukać go, aby uzyskać wyniki w przeglądarce. Prezentacja polegała na nagraniu danej rzeczy, jednocześnie zadając pytania. Google dostarczył odpowiedź w formie tekstowej. Mówiąc najprościej, Google intensywnie wykorzystuje generatywną sztuczną inteligencję w wyszukiwaniu, zarówno pod kątem wyników, jak i różnych sposobów ich uzyskiwania.
Konwersja tekstu na wideo z Veo
Veo może generować minutowe filmy w jakości 1080p, a wszystko to za pomocą prostego polecenia. Ten monit może obejmować efekty kinowe, takie jak prośba o wykonanie zdjęcia poklatkowego lub zdjęcia z lotu ptaka, a wczesne próbki wyglądają imponująco. Nie musisz też zaczynać od zera – prześlij wideo wejściowe za pomocą polecenia, a Veo może edytować klip zgodnie z Twoimi żądaniami. Istnieje również możliwość dodawania masek i modyfikowania określonych części wideo.
Android z mnóstwem możliwości Gemini
Gemini od teraz jest integrowane z rdzeniem Androida, aby integrować się z Twoim przepływem informacji. Jak pokazano, Gemini może teraz przeglądać, czytać i rozumieć zawartość ekranu Twojego telefonu, pozwalając mu przewidywać pytania dotyczące tego, co przeglądasz. Dzięki temu może poznać kontekst oglądanego filmu, przewidzieć prośbę o podsumowanie podczas przeglądania obszernego pliku PDF lub przygotować się na niezliczone pytania dotyczące aplikacji, w której się znajdujesz.
Google Workspace stanie się dużo mądrzejsze
W Gmail, dzięki nowemu panelowi bocznemu po lewej stronie, możesz poprosić Gemini o podsumowanie wszystkich ostatnich rozmów ze współpracownikiem. Wynik jest następnie podsumowywany w punktach, podkreślających najważniejsze aspekty. Google Meet może przekazać Ci najważniejsze momenty spotkania lub pytania, o które mogą pytać inne osoby biorące udział w rozmowie. W Arkuszach Google Gemini pomoże nam w zrozumieniu danych i przetwarzaniu żądań, takich jak pobieranie określonej sumy lub zbioru danych. Najbardziej futurystycznym przykładem może być wirtualny członek drużyny „Chip”. Może działać na czacie G i być wywoływany w celu wykonania różnych zadań lub zapytań.