[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:00.56,0:00:01.88,Default,,0000,0000,0000,,Dziesięć lat temu Dialogue: 0,0:00:01.88,0:00:04.80,Default,,0000,0000,0000,,badacze rozpoznawania obrazów\Nsądzili, że nauczenie komputera Dialogue: 0,0:00:04.80,0:00:07.50,Default,,0000,0000,0000,,rozróżniania kota od psa Dialogue: 0,0:00:07.52,0:00:09.50,Default,,0000,0000,0000,,jest prawie niemożliwe Dialogue: 0,0:00:09.52,0:00:13.22,Default,,0000,0000,0000,,nawet przy sporym postępie\Nrozwoju sztucznej inteligencji. Dialogue: 0,0:00:13.24,0:00:16.80,Default,,0000,0000,0000,,Teraz jest to możliwe\Nz dokładnością większą niż 99%. Dialogue: 0,0:00:17.68,0:00:19.54,Default,,0000,0000,0000,,Nazywamy to klasyfikacją obrazu: Dialogue: 0,0:00:19.56,0:00:22.66,Default,,0000,0000,0000,,dostarcz obraz,\Nprzypisz do niego etykietę... Dialogue: 0,0:00:22.68,0:00:25.72,Default,,0000,0000,0000,,komputery znają teraz\Ntysiące innych kategorii. Dialogue: 0,0:00:26.68,0:00:29.58,Default,,0000,0000,0000,,Jestem doktorantem\Nna Uniwersytecie Waszyngtońskim Dialogue: 0,0:00:29.60,0:00:31.49,Default,,0000,0000,0000,,i pracuję nad projektem "Darknet", Dialogue: 0,0:00:31.50,0:00:33.38,Default,,0000,0000,0000,,który jest frameworkiem\Nsieci neuronowej Dialogue: 0,0:00:33.38,0:00:36.06,Default,,0000,0000,0000,,do ćwiczenia i testowana\Nmodeli rozpoznawania obrazów. Dialogue: 0,0:00:36.08,0:00:39.06,Default,,0000,0000,0000,,Sprawdźmy więc, co "Darknet" sądzi Dialogue: 0,0:00:39.08,0:00:40.84,Default,,0000,0000,0000,,o tym obrazie. Dialogue: 0,0:00:42.52,0:00:45.76,Default,,0000,0000,0000,,Wprowadzenie tego obrazu do klasyfikatora Dialogue: 0,0:00:46.12,0:00:48.58,Default,,0000,0000,0000,,nie tylko da nam prognozę,\Nczy to pies czy kot, Dialogue: 0,0:00:48.60,0:00:50.93,Default,,0000,0000,0000,,ale nawet prognozę konkretnej rasy. Dialogue: 0,0:00:50.93,0:00:53.22,Default,,0000,0000,0000,,Taki poziom szczegółowości\Njest teraz dostępny. Dialogue: 0,0:00:53.22,0:00:54.78,Default,,0000,0000,0000,,I jest to poprawne rozpoznanie. Dialogue: 0,0:00:54.80,0:00:56.64,Default,,0000,0000,0000,,Mój pies to naprawdę malamut. Dialogue: 0,0:00:57.04,0:01:01.38,Default,,0000,0000,0000,,Dokonaliśmy niesamowitego postępu\Nw klasyfikacji obrazów, Dialogue: 0,0:01:01.40,0:01:05.06,Default,,0000,0000,0000,,ale co się stanie,\Njeśli wprowadzimy taki obraz? Dialogue: 0,0:01:12.64,0:01:16.54,Default,,0000,0000,0000,,Klasyfikator zwraca podobną prognozę Dialogue: 0,0:01:16.56,0:01:19.66,Default,,0000,0000,0000,,i jest poprawna - na zdjęciu jest malamut, Dialogue: 0,0:01:19.68,0:01:23.29,Default,,0000,0000,0000,,ale na podstawie samej etykiety\Nnie można dowiedzieć się wiele Dialogue: 0,0:01:23.29,0:01:25.15,Default,,0000,0000,0000,,na temat tego,\Nco dzieje się na zdjęciu. Dialogue: 0,0:01:25.15,0:01:27.42,Default,,0000,0000,0000,,Do tego potrzeba\Nczegoś bardziej zaawansowanego. Dialogue: 0,0:01:27.42,0:01:29.86,Default,,0000,0000,0000,,Pracuję nad wykrywaniem obiektów. Dialogue: 0,0:01:29.88,0:01:32.82,Default,,0000,0000,0000,,Patrzymy na obraz i próbujemy\Nznaleźć wszystkie obiekty, Dialogue: 0,0:01:32.84,0:01:34.30,Default,,0000,0000,0000,,wpisujemy je w bryły brzegowe Dialogue: 0,0:01:34.32,0:01:35.84,Default,,0000,0000,0000,,i je nazywamy. Dialogue: 0,0:01:36.40,0:01:39.68,Default,,0000,0000,0000,,Oto co się dzieje, kiedy wprowadzimy\Nten obraz do detektora. Dialogue: 0,0:01:41.24,0:01:43.50,Default,,0000,0000,0000,,Z tego rodzaju rezultatem Dialogue: 0,0:01:43.50,0:01:46.24,Default,,0000,0000,0000,,możemy zrobić znacznie więcej,\Nstosując nasze algorytmy. Dialogue: 0,0:01:46.24,0:01:49.22,Default,,0000,0000,0000,,Komputer wie,\Nże na zdjęciu jest kot i pies. Dialogue: 0,0:01:49.24,0:01:51.50,Default,,0000,0000,0000,,Zna ich względne położenie, Dialogue: 0,0:01:51.52,0:01:52.74,Default,,0000,0000,0000,,ich wielkość. Dialogue: 0,0:01:52.76,0:01:54.70,Default,,0000,0000,0000,,Może też uzyskać dodatkowe informacje: Dialogue: 0,0:01:54.72,0:01:56.68,Default,,0000,0000,0000,,w tle leży książka. Dialogue: 0,0:01:57.28,0:02:00.54,Default,,0000,0000,0000,,Żeby zbudować system\Nna rozpoznawaniu obrazu, Dialogue: 0,0:02:00.56,0:02:04.02,Default,,0000,0000,0000,,powiedzmy samoprowadzący się pojazd\Nlub manipulator robotyczny, Dialogue: 0,0:02:04.04,0:02:06.50,Default,,0000,0000,0000,,potrzeba właśnie tego typu informacji. Dialogue: 0,0:02:06.52,0:02:09.76,Default,,0000,0000,0000,,Potrzeba czegoś do interakcji\Nze światem fizycznym. Dialogue: 0,0:02:10.57,0:02:13.02,Default,,0000,0000,0000,,Kiedy zacząłem pracować\Nnad wykrywaniem obiektów, Dialogue: 0,0:02:13.04,0:02:16.34,Default,,0000,0000,0000,,przetworzenie jednego obrazu\Nzajmowało 20 sekund. Dialogue: 0,0:02:16.36,0:02:20.24,Default,,0000,0000,0000,,Aby lepiej odczuć dlaczego prędkość\Njest tak ważna w tej dziedzinie, Dialogue: 0,0:02:21.12,0:02:23.66,Default,,0000,0000,0000,,pokażę przykład detektora obiektów, Dialogue: 0,0:02:23.68,0:02:26.10,Default,,0000,0000,0000,,który przetwarza obraz w 2 sekundy. Dialogue: 0,0:02:26.12,0:02:28.74,Default,,0000,0000,0000,,To 10 razy szybciej Dialogue: 0,0:02:28.76,0:02:32.30,Default,,0000,0000,0000,,niż ten przetwarzający obraz w 20 sekund, Dialogue: 0,0:02:32.32,0:02:34.98,Default,,0000,0000,0000,,a i tak można zaobserwować,\Nże zanim dokonał prognozy, Dialogue: 0,0:02:35.00,0:02:37.04,Default,,0000,0000,0000,,zmieniła się cała sytuacja, Dialogue: 0,0:02:37.88,0:02:40.30,Default,,0000,0000,0000,,a to nie byłoby zbyt użyteczne\Nw zastosowaniu. Dialogue: 0,0:02:41.76,0:02:44.26,Default,,0000,0000,0000,,Jeśli dziesięciokrotnie\Nprzyspieszymy ten proces, Dialogue: 0,0:02:44.28,0:02:47.10,Default,,0000,0000,0000,,tak wygląda detektor\Nprzy pięciu klatkach an sekundę. Dialogue: 0,0:02:47.12,0:02:48.66,Default,,0000,0000,0000,,Wygląda to dużo lepiej, Dialogue: 0,0:02:48.68,0:02:50.66,Default,,0000,0000,0000,,ale na przykład Dialogue: 0,0:02:50.68,0:02:52.98,Default,,0000,0000,0000,,w przypadku znacznego ruchu Dialogue: 0,0:02:53.00,0:02:55.85,Default,,0000,0000,0000,,nie chciałbym, żeby taki system\Nprowadził mój samochód. Dialogue: 0,0:02:57.12,0:02:59.78,Default,,0000,0000,0000,,Tak wygląda nasz system\Ndziałający w czasie rzeczywistym Dialogue: 0,0:02:59.78,0:03:01.00,Default,,0000,0000,0000,,na moim laptopie. Dialogue: 0,0:03:01.00,0:03:04.14,Default,,0000,0000,0000,,Płynnie śledzi mnie\Nw trakcie poruszania się w ramie Dialogue: 0,0:03:04.16,0:03:07.88,Default,,0000,0000,0000,,i jest odporny na dużą\Nróżnorodność zmian wielkości, Dialogue: 0,0:03:09.44,0:03:10.64,Default,,0000,0000,0000,,pozy, Dialogue: 0,0:03:11.28,0:03:13.14,Default,,0000,0000,0000,,rotacji poziomej. Dialogue: 0,0:03:13.16,0:03:14.38,Default,,0000,0000,0000,,O to chodziło. Dialogue: 0,0:03:14.40,0:03:16.14,Default,,0000,0000,0000,,Tego właśnie potrzeba, Dialogue: 0,0:03:16.16,0:03:19.06,Default,,0000,0000,0000,,żeby budować systemy \Nna rozpoznawaniu obrazu. Dialogue: 0,0:03:19.08,0:03:23.08,Default,,0000,0000,0000,,(Brawa) Dialogue: 0,0:03:24.28,0:03:26.46,Default,,0000,0000,0000,,Zaledwie w kilka lat Dialogue: 0,0:03:26.48,0:03:29.14,Default,,0000,0000,0000,,przeszliśmy od 20 sekund na obraz Dialogue: 0,0:03:29.16,0:03:32.70,Default,,0000,0000,0000,,do 20 milisekund na obraz\N- tysiąc razy szybciej. Dialogue: 0,0:03:32.72,0:03:34.14,Default,,0000,0000,0000,,Jak to się stało? Dialogue: 0,0:03:34.16,0:03:37.18,Default,,0000,0000,0000,,W przeszłości systemy wykrywania obiektów Dialogue: 0,0:03:37.20,0:03:39.14,Default,,0000,0000,0000,,rozbiłyby ten obraz Dialogue: 0,0:03:39.16,0:03:41.62,Default,,0000,0000,0000,,na mnóstwo obszarów Dialogue: 0,0:03:41.64,0:03:44.90,Default,,0000,0000,0000,,i wprowadziłyby każdy z nich\Ndo klasyfikatora, Dialogue: 0,0:03:44.92,0:03:47.46,Default,,0000,0000,0000,,a wysokie rezultaty klasyfikatora Dialogue: 0,0:03:47.48,0:03:50.62,Default,,0000,0000,0000,,byłyby uważane za wykrycie obiektów. Dialogue: 0,0:03:50.64,0:03:54.70,Default,,0000,0000,0000,,Ale to wymagało wprowadzenia obrazu\Ndo klasyfikatora tysiące razy, Dialogue: 0,0:03:54.72,0:03:57.64,Default,,0000,0000,0000,,tysięcy ewaluacji sieci neuronowych,\Naby otrzymać wykrycie. Dialogue: 0,0:03:59.24,0:04:01.37,Default,,0000,0000,0000,,Zamiast tego nauczyliśmy pojedynczą sieć Dialogue: 0,0:04:01.37,0:04:03.80,Default,,0000,0000,0000,,całkowitego wykrywania. Dialogue: 0,0:04:03.80,0:04:08.08,Default,,0000,0000,0000,,Tworzy ona wszystkie bryły brzegowe\Ni prawdopodobieństwa klasowe jednocześnie. Dialogue: 0,0:04:08.68,0:04:12.18,Default,,0000,0000,0000,,Nasz system, zamiast tysiąc razy\Nanalizować obraz Dialogue: 0,0:04:12.20,0:04:13.66,Default,,0000,0000,0000,,do jednego wykrycia, Dialogue: 0,0:04:13.68,0:04:14.94,Default,,0000,0000,0000,,analizuje go tylko raz Dialogue: 0,0:04:14.96,0:04:17.88,Default,,0000,0000,0000,,i dlatego nazywamy to\Nmetodą wykrywania obrazów YOLO. Dialogue: 0,0:04:19.36,0:04:23.34,Default,,0000,0000,0000,,Z tą prędkością nie musimy\Nograniczać się jedynie do obrazów. Dialogue: 0,0:04:23.36,0:04:25.78,Default,,0000,0000,0000,,Możemy przetwarzać wideo\Nw czasie rzeczywistym. Dialogue: 0,0:04:25.80,0:04:28.90,Default,,0000,0000,0000,,Teraz zamiast kota i psa Dialogue: 0,0:04:28.92,0:04:31.88,Default,,0000,0000,0000,,można też obserwować\Nich ruch i interakcję. Dialogue: 0,0:04:34.56,0:04:36.62,Default,,0000,0000,0000,,Trenowaliśmy ten detektor Dialogue: 0,0:04:36.64,0:04:41.02,Default,,0000,0000,0000,,na osiemdziesięciu różnych klasach Dialogue: 0,0:04:41.04,0:04:44.30,Default,,0000,0000,0000,,w zbiorze danych Microsoft COCO. Dialogue: 0,0:04:44.32,0:04:47.66,Default,,0000,0000,0000,,Zawiera on różnorodne rzeczy,\Nna przykład łyżkę i widelec, miskę Dialogue: 0,0:04:47.68,0:04:49.67,Default,,0000,0000,0000,,i podobne przedmioty codziennego użytku. Dialogue: 0,0:04:50.36,0:04:53.46,Default,,0000,0000,0000,,Zawiera również\Nbardziej egzotyczne obrazy: Dialogue: 0,0:04:53.48,0:04:56.74,Default,,0000,0000,0000,,zwierzęta, samochody, zebry, żyrafy. Dialogue: 0,0:04:56.76,0:04:58.70,Default,,0000,0000,0000,,Teraz zrobimy coś dla zabawy. Dialogue: 0,0:04:58.72,0:05:00.82,Default,,0000,0000,0000,,Skierujemy detektor na publiczność Dialogue: 0,0:05:00.84,0:05:02.86,Default,,0000,0000,0000,,i zobaczymy, co się da wykryć. Dialogue: 0,0:05:02.88,0:05:04.50,Default,,0000,0000,0000,,Czy ktoś chce pluszaka? Dialogue: 0,0:05:06.00,0:05:07.76,Default,,0000,0000,0000,,Mam tu kilka misiów. Dialogue: 0,0:05:10.04,0:05:14.58,Default,,0000,0000,0000,,Możemy trochę obniżyć\Nnasz próg wykrywalności, Dialogue: 0,0:05:14.60,0:05:18.00,Default,,0000,0000,0000,,aby znaleźć więcej osób na widowni. Dialogue: 0,0:05:19.50,0:05:21.90,Default,,0000,0000,0000,,Zobaczmy, czy uda nam się\Nrozpoznać te znaki stopu. Dialogue: 0,0:05:21.92,0:05:23.80,Default,,0000,0000,0000,,Widzimy kilka plecaków. Dialogue: 0,0:05:25.88,0:05:27.72,Default,,0000,0000,0000,,Zróbmy niewielkie zbliżenie. Dialogue: 0,0:05:30.32,0:05:31.58,Default,,0000,0000,0000,,Świetnie. Dialogue: 0,0:05:31.60,0:05:34.78,Default,,0000,0000,0000,,Całe przetwarzanie ma miejsce\Nw czasie rzeczywistym Dialogue: 0,0:05:34.80,0:05:36.00,Default,,0000,0000,0000,,na laptopie. Dialogue: 0,0:05:37.08,0:05:38.54,Default,,0000,0000,0000,,Należy pamiętać, Dialogue: 0,0:05:38.56,0:05:41.78,Default,,0000,0000,0000,,że jest to system wykrywania\Nobiektów do użytku ogólnego, Dialogue: 0,0:05:41.80,0:05:46.80,Default,,0000,0000,0000,,więc możemy go wytrenować\Ndla dowolnej kategorii obrazów. Dialogue: 0,0:05:48.32,0:05:50.86,Default,,0000,0000,0000,,Ten sam kod, którego używamy Dialogue: 0,0:05:50.88,0:05:53.34,Default,,0000,0000,0000,,do znalezienia znaków stopu, pieszych, Dialogue: 0,0:05:53.36,0:05:55.34,Default,,0000,0000,0000,,lub rowerów w autonomicznym pojeździe Dialogue: 0,0:05:55.36,0:05:58.22,Default,,0000,0000,0000,,można wykorzystać\Ndo znalezienia komórek rakowych Dialogue: 0,0:05:58.24,0:06:01.26,Default,,0000,0000,0000,,w biopsji tkanki. Dialogue: 0,0:06:01.28,0:06:05.32,Default,,0000,0000,0000,,Badacze na całym świece\Nużywają już tej technologii Dialogue: 0,0:06:06.24,0:06:09.66,Default,,0000,0000,0000,,do rozwoju w dziedzinach\Ntakich jak medycyna, czy robotyka. Dialogue: 0,0:06:09.68,0:06:11.06,Default,,0000,0000,0000,,Dziś rano czytałem pracę Dialogue: 0,0:06:11.08,0:06:15.65,Default,,0000,0000,0000,,omawiającą zliczanie zwierząt\Nw Parku Narodowym Nairobi Dialogue: 0,0:06:15.65,0:06:18.84,Default,,0000,0000,0000,,przy wykorzystaniu YOLO jako\Nczęści systemu wykrywania obiektów. Dialogue: 0,0:06:18.84,0:06:21.94,Default,,0000,0000,0000,,Jest to możliwe ponieważ "Darknet"\Njest programem open source, Dialogue: 0,0:06:21.96,0:06:24.76,Default,,0000,0000,0000,,będącym własnością publiczną \Ndo wolnego użytku. Dialogue: 0,0:06:25.60,0:06:31.30,Default,,0000,0000,0000,,(Brawa) Dialogue: 0,0:06:31.32,0:06:36.26,Default,,0000,0000,0000,,Chcieliśmy jednak, żeby wykrywanie\Nbyło bardziej przystępne i przydatne, Dialogue: 0,0:06:36.28,0:06:40.34,Default,,0000,0000,0000,,więc poprzez połączenie\Noptymalizacji modelu, Dialogue: 0,0:06:40.36,0:06:42.66,Default,,0000,0000,0000,,binaryzacji i aproksymacji sieci Dialogue: 0,0:06:42.68,0:06:46.60,Default,,0000,0000,0000,,otrzymaliśmy wykrywanie obiektów\Ndziałające na telefonie. Dialogue: 0,0:06:52.80,0:06:58.12,Default,,0000,0000,0000,,(Brawa) Dialogue: 0,0:06:58.96,0:07:03.69,Default,,0000,0000,0000,,Jestem bardzo podekscytowany,\Nbo mamy potężne rozwiązanie problemu Dialogue: 0,0:07:03.69,0:07:06.39,Default,,0000,0000,0000,,rozpoznawania obrazów\Nna komputerach o niskiej wydajności Dialogue: 0,0:07:06.39,0:07:10.24,Default,,0000,0000,0000,,i każdy może je wykorzystać\Ni stworzyć coś przy jego użyciu. Dialogue: 0,0:07:10.25,0:07:13.42,Default,,0000,0000,0000,,Reszta zależy od was Dialogue: 0,0:07:13.44,0:07:16.38,Default,,0000,0000,0000,,i ludzi na całym świecie\Nz dostępem do tego oprogramowania. Dialogue: 0,0:07:16.40,0:07:17.84,Default,,0000,0000,0000,,Nie mogę się doczekać tego, Dialogue: 0,0:07:17.87,0:07:20.08,Default,,0000,0000,0000,,co ludzie stworzą\Nprzy użyciu tej technologii. Dialogue: 0,0:07:20.08,0:07:21.30,Default,,0000,0000,0000,,Dziękuję. Dialogue: 0,0:07:21.32,0:07:24.76,Default,,0000,0000,0000,,(Brawa)