„Google“ kuria naują vaizdo sintezės metodą

  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '3:a31efda5b36368185d55e3620d12516f' in /srv/www/htdocs/naujienos/includes/cache.inc on line 26.
  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: UPDATE cache_filter SET data = '<p>&nbsp;</p>\n<p>Keturi mokslininkai iš „Google“ paskelbė mokslinį darbą, atskleidusį įdomius rezultatus – dirbtinių neuroninių tinklų ir mašininio mokymosi panaudojimą, kuriant įvairius vaizdus iš nuotraukų, tačiau jau kitais rakursais.</p>\n<p>Darbas, pavadintas „DeepStereo: Learning to Predict New Views from the World\'s Imagery\" (Gilusis Stereo: mokantis numatyti naujus vaizdus iš nuotraukų“), atskleidė, kad įmanoma sukurti vaizdus, atitinkančius video įrašą, turint tik keliasdešimt aplinkos nuotraukų - sluoksnių, ir leidžiant kompiuterinei sistemai sintetinti realaus pasaulio vaizdus, užpildant trūkstamus kadrus, tarsi video kamera judėtų nuo vienos nuotraukos prie kitos.</p>\n<p>Žodis „gilus“ pavadinime kilo iš neuroninių tinklų topologijos, ir reiškia, kad jie kompiuteryje modeliuojami kaip turintys daug sluoksnių – gilūs. Darbe buvo naudojami 96 sluoksniai, o tinklo apmokymui buvo panaudota 100 tūkstančių nuotraukų.</p>\n<p>Kompiuterio užduotis buvo analizuoti kiekvieną vaizdą kaip pikselių rinkinį, ir numatyti kaip atrodytų kiekvienas pikselis, esantis kadre prieš tą vaizdą ir po jo.</p>\n<p>„DeepStereo“ algoritmui buvo duodamos dvi „Street View“ gretimai padarytos nuotraukos, ir jis sintetindavo trečią vaizdą iš kiek kitos perspektyvos, po to jį panaudodavo sekančiam vaizdui kurti, ir taip sukurdavo eiles kadrų, atrodančių tarsi realus video įrašas.</p>\n<p>&nbsp;</p>\n<p>Straipsnyje pateikiamas ir rezultatas – iš „Street View“ nuotraukų kompiuterio padarytas video įrašas, atrodantis taip, tarsi iš tiesų buvo filmuojama judančia kamera.</p>\n<p>&nbsp;</p>\n<p>Darbo autorių teigimu, tai vienas pirmųjų sėkmingų bandymų panaudoti dirbtinius neuroninius tinklus naujų vaizdų sintezei iš realių nuotraukų. Tai galima laikyti ir vaizdo interpoliavimu, sukuriant trimačius vaizdus iš dvimačių nuotraukų.</p>\n<p>&nbsp;</p>\n<p>„Street View“ galima laikyti ir vienu didžiausių pasaulio fotoalbumų, o gal ir pačiu didžiausiu, todėl nekeista, kad „Google“ nori pamėginti jam pridėti dar vieną dimensiją ir sukurti tikrovišką trimatį pasaulio atvaizdą.</p>\n<p>&nbsp;</p>\n<p>Šaltinis: DeepStereo: Learning to Predict New Views from the World\'s Imagery, arXiv:1506.06825 [cs.CV]&nbsp;<a href=\"http://arxiv.org/abs/1506.06825\" target=\"_blank\"><strong>arxiv.org/abs/1506.06825</strong></a></p>\n', created = 1561491867, expire = 1561578267, headers = '', serialized = 0 WHERE cid = '3:a31efda5b36368185d55e3620d12516f' in /srv/www/htdocs/naujienos/includes/cache.inc on line 109.
  • user warning: Table './naujienos01/captcha_sessions' is marked as crashed and should be repaired query: INSERT into captcha_sessions (uid, sid, ip_address, timestamp, form_id, solution, status, attempts) VALUES (0, '5078sfei67g1g7tur7qfupjab307dfgi', '18.212.243.191', 1561491867, 'comment_form', 'undefined', 0, 0) in /srv/www/htdocs/naujienos/sites/all/modules/captcha/captcha.inc on line 92.
  • user warning: Table './naujienos01/captcha_sessions' is marked as crashed and should be repaired query: SELECT status FROM captcha_sessions WHERE csid = 0 in /srv/www/htdocs/naujienos/sites/all/modules/captcha/captcha.inc on line 112.
  • user warning: Table './naujienos01/captcha_sessions' is marked as crashed and should be repaired query: SELECT status FROM captcha_sessions WHERE csid = 0 in /srv/www/htdocs/naujienos/sites/all/modules/captcha/captcha.inc on line 112.
  • user warning: Table './naujienos01/captcha_sessions' is marked as crashed and should be repaired query: UPDATE captcha_sessions SET timestamp=1561491867, solution='C5N' WHERE csid=0 in /srv/www/htdocs/naujienos/sites/all/modules/captcha/captcha.inc on line 104.
  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '3:d3772bfe13f45a6d159b3f3caa708d8a' in /srv/www/htdocs/naujienos/includes/cache.inc on line 26.
  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: UPDATE cache_filter SET data = '<p><a target=\"_blank\" href=\"http://www.hey.lt/details.php?id=mokslasplius\"><img width=\"88\" height=\"31\" border=\"0\" src=\"http://www.hey.lt/count.php?id=mokslasplius\" alt=\"Hey.lt - lankytojų skaitliukas\"></a></p>\n', created = 1561491868, expire = 1561578268, headers = '', serialized = 0 WHERE cid = '3:d3772bfe13f45a6d159b3f3caa708d8a' in /srv/www/htdocs/naujienos/includes/cache.inc on line 109.
  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: SELECT data, created, headers, expire, serialized FROM cache_filter WHERE cid = '3:9d464a75de7638794fc244f43967505a' in /srv/www/htdocs/naujienos/includes/cache.inc on line 26.
  • user warning: Table './naujienos01/cache_filter' is marked as crashed and should be repaired query: UPDATE cache_filter SET data = '<style>#mvv {position: absolute; top: 1px; left: 50%; margin-left: -505px;} #mvv a, #mvv a:visited {color: #000; padding: 3px 5px; background: #A0A0A0; text-decoration: none;} #mvv a:hover {color: #fff; background: #5F5F5F;}</style><div id=\"mvv\"><a href=\"http://mokslasplius.lt\">mokslasplius.lt</a></div>\n', created = 1561491868, expire = 1561578268, headers = '', serialized = 0 WHERE cid = '3:9d464a75de7638794fc244f43967505a' in /srv/www/htdocs/naujienos/includes/cache.inc on line 109.

 

Keturi mokslininkai iš „Google“ paskelbė mokslinį darbą, atskleidusį įdomius rezultatus – dirbtinių neuroninių tinklų ir mašininio mokymosi panaudojimą, kuriant įvairius vaizdus iš nuotraukų, tačiau jau kitais rakursais.

Darbas, pavadintas „DeepStereo: Learning to Predict New Views from the World's Imagery" (Gilusis Stereo: mokantis numatyti naujus vaizdus iš nuotraukų“), atskleidė, kad įmanoma sukurti vaizdus, atitinkančius video įrašą, turint tik keliasdešimt aplinkos nuotraukų - sluoksnių, ir leidžiant kompiuterinei sistemai sintetinti realaus pasaulio vaizdus, užpildant trūkstamus kadrus, tarsi video kamera judėtų nuo vienos nuotraukos prie kitos.

Žodis „gilus“ pavadinime kilo iš neuroninių tinklų topologijos, ir reiškia, kad jie kompiuteryje modeliuojami kaip turintys daug sluoksnių – gilūs. Darbe buvo naudojami 96 sluoksniai, o tinklo apmokymui buvo panaudota 100 tūkstančių nuotraukų.

Kompiuterio užduotis buvo analizuoti kiekvieną vaizdą kaip pikselių rinkinį, ir numatyti kaip atrodytų kiekvienas pikselis, esantis kadre prieš tą vaizdą ir po jo.

„DeepStereo“ algoritmui buvo duodamos dvi „Street View“ gretimai padarytos nuotraukos, ir jis sintetindavo trečią vaizdą iš kiek kitos perspektyvos, po to jį panaudodavo sekančiam vaizdui kurti, ir taip sukurdavo eiles kadrų, atrodančių tarsi realus video įrašas.

 

Straipsnyje pateikiamas ir rezultatas – iš „Street View“ nuotraukų kompiuterio padarytas video įrašas, atrodantis taip, tarsi iš tiesų buvo filmuojama judančia kamera.

 

Darbo autorių teigimu, tai vienas pirmųjų sėkmingų bandymų panaudoti dirbtinius neuroninius tinklus naujų vaizdų sintezei iš realių nuotraukų. Tai galima laikyti ir vaizdo interpoliavimu, sukuriant trimačius vaizdus iš dvimačių nuotraukų.

 

„Street View“ galima laikyti ir vienu didžiausių pasaulio fotoalbumų, o gal ir pačiu didžiausiu, todėl nekeista, kad „Google“ nori pamėginti jam pridėti dar vieną dimensiją ir sukurti tikrovišką trimatį pasaulio atvaizdą.

 

Šaltinis: DeepStereo: Learning to Predict New Views from the World's Imagery, arXiv:1506.06825 [cs.CV] arxiv.org/abs/1506.06825

Vaizdinė CAPTCHA užduotis