W oparciu o duży model AI buduj delikatne interakcje emocjonalne, które mogą być postrzegane przez konsumentów
Poprzez czujniki dotykowe, mikrofony, kamery i czujniki detekcji podczerwieni obejmujące głowę i z powrotem, może postrzegać otaczające środowisko i wchodzić w interakcje z otaczającym środowiskiem.
Połączenie wprowadzania głosowego i wprowadzania wizualnego (koncentrując się na klatkach statycznych) przy użyciu multimodalnego obrazu tekstowego
duży model” do wyprowadzania rozmów
Czujniki i mikrofony wykrywające podczerwień wykrywają aktywność biologiczną i aktywnie wchodzą w interakcję
użytkownicy
Multimodalna ekspresja emocjonalna poprzez silniki krokowe w ciele i dłoni, wyświetlacz LCD (oczy) i głośniki
Pulpit, wyświetlacz przy łóżku, przytulanie
I: Decyzja o zakupie: Typowe zalety, które można zwizualizować, mogą wzbudzić zainteresowanie
| ASR + LLM Wizualne rozumienie obrazu Kliknij wydarzenia Timer na podczerwień Pamięć dialogowa Ustawienia postaci |
| Sieciowa platforma modeli wielkoskalowych oparta na chmurze (Percepcja multimodalna, model dużego języka, pamięć konwersacyjna, zapytanie sieciowe) |
| Warstwa multimodalnego systemu percepcji i kontroli | |||
| Rozumienie sceny Sterowanie wyzwalaczem | Sterowanie oświetleniem | Sterowanie silnikiem | Kontrola wyświetlania |
| Warstwa osadzania sprzętu (korpus robota) | ||||
Scena
zrozumienie Sterowanie wyzwalaczem |
Oświetlenie
Kontrola |
Sterowanie silnikiem |
Wyświetlacz
Kontrola |
Wyświetlacz
Kontrola |
| Polegać | Dane techniczne/funkcje |
| Mikrofon | Obsługuje rozpoznawanie głosu w dalekim polu (zasięg 5 metrów) i kierunkowy odbiór dźwięku polecenia głosowe. |
| Kamera | Używany do rozpoznawania środowiska i obiektów. |
| Czujnik podczerwieni | Używany do wybudzania przy małej mocy wywołanego przez ludzkie ciało/zwierzę. |
| Czujnik dotykowy | Rozproszone moduły dotykowe (głowa, plecy, brzuch) służą do wykrywania głaskania i poklepywania (np „dotykanie głowy” i „łaskotanie”). |
| Czujnik grawitacyjny | Wyczuj stan ruchu ciała i wygeneruj „sygnał alarmowy” (taki jak komunikat głosowy „Upadłem i boli”), gdy produkt spada. |
| Polegać | Dane techniczne/funkcje |
| Ekran ekspresji LCD | Ekran LCD o przekątnej 4,28 cala (oczy), obsługuje wyświetlanie dynamicznej ekspresji i wyświetlanie obuoczne (np wizualne sprzężenie zwrotne podczas „udawania martwego” lub „udawania uroczego”). |
| Głośnik | Głośnik pełnozakresowy mono/4 Ω, 5 W (np. głos podczas „śpiewania piosenki” lub „opowiadania dowcipu”). |
| Pełnokolorowe paski świetlne LED | Kolorowe paski świetlne, które odtwarzają odpowiednie efekty świetlne „stanu emocjonalnego” lub mogą być używane jako kontrolki. |
| Polegać | Dane techniczne/funkcje |
| Silnik krokowy | Podwójne silniki do machania i obracania głowy (talia) |
| Polegać | Dane techniczne/funkcje |
| Główny układ kontrolny | V821: podstawowe sterowanie funkcjami, przetwarzanie głosu, dwuoczny asynchroniczny wyświetlacz |
| Wi-Fi/Bluetooth | Praktyczne funkcje |
| Jednostka magazynowa | Moduł interakcji człowiek-komputer |
| Polegać | Dane techniczne/funkcje |
| Bateria litowa | Pojemność 3000 mAh/7,2 V, obsługuje szybkie ładowanie, 2 godziny pracy na baterii i 2 dni pracy kompleksowa gotowość; wyposażony w chip wykrywający moc. |
| Opłata | USB typu C |
| Moduły akcesoriów | Można zmieniać różne style odzieży i akcesoriów |
| zły | przewraca oczami | mdleć | zachowuj się fajnie |
| entuzjazm | smutny | niezręczny | nieśmiały |
| śmiejąc się głośno | uśmiech | oczy serca | gotowość |
| spać | Uroczy | skrzywdzony | Sun Wukonga |
| oszołomienie | ciekawski | zez | zło |