Wordt educatief videomateriaal in Nederland vaak ondertiteld? Welke vormen van ondertitelen zijn mogelijk?
Weblecture perspectief Nee, want..
Automatisering dillema s OCR (optical character recognition), Speech-to-text (ASR), etc..
Wensen Lecture Capture klanten Automatisch publiceren na opname Automatisch opnemen (roosteren) Automatisch meta dateren (rooster gevoed door studiegids) Automatische camera aansturing (tracking camera s) Automatisch opruimen/archiveren (workflow) Single Sign On met LMS (API koppeling met bijv BlackBoard)
Nog meer wensen. Automatisch tekst op slides herkennen en doorzoekbaar maken (OCR) Gesproken tekst automatisch in ondertiteling omzetten en doorzoekbaar maken (ASR) Engels gesproken tekst automatisch Nederlands ondertitelen Nederlands gesproken tekst automatisch Engels ondertitelen Etc..
Google translate version of: Just give me a reason
OCR Optical Character Recognition
Stappenplan 1. Opnemen van weblecture 2. Publiceren van opname naar video platform 3. Bepaal het videodeel met presentatie in de opname 4. Afbeelding maken bij scene detectie 5. Automatische tekst herkenning 6. Ruwe tekst toevoegen aan metadata opname 7. Indexeren via zoekmachine 8. Slides als markeringen toevoegen aan player
Metadata
Voorbeeld 1
Voorbeeld 2
Voorbeeld 3
Voorbeeld 4
Voorbeeld 5
Voorbeeld 7
Voorbeeld 7
Onze conclusies Ruwe OCR tekst niet tonen aan eindgebruiker Ruwe OCR wel bruikbaar voor zoekmachines
ASR Automated Speech Recognition
YouTube werkt voortdurend aan de verbetering van spraakherkenningstechnologie. Het kan echter altijd gebeuren dat de automatische ondertiteling de gesproken tekst niet goed overzet vanwege een verkeerde uitspraak, accenten, dialecten of achtergrondgeluiden. Controleer automatische ondertiteling altijd goed en bewerk stukken die niet goed zijn overgezet
Automated Speech Recognition (ASR) Machine Transcription With ASR, an algorithm instantly recognizes the words spoken in your video and provides machine-based captions for indexing and search. For when you need searchable, discoverable video, this option handles high volumes, fast. Quick and cost-effective 70-95%+ accuracy Trainable ASR Engine Do It Yourself Captions Editor Ideal for converting large volumes of video into searchable content for SEO, internal search, and recommendation engines Machine-Based Learning: improves over time, with ability to customize glossary
Wat kun je in de collegezaal verwachten? Maar nu realistisch Nederlandse docent geeft Nederlandse presentatie met Nederlandse slides Engelse docent geeft Engelse presentatie met Engelse slides Nederlandse docent geeft Nederlandse presentatie met Engelse slides Nederlandse docent geeft Engelse presentatie met Engelse slides Nederlandse docent geeft Engelse presentatie met Nederlandse slides Nederlandse docent geeft Nederlandse presentatie met deels Engelse en deels Nederlandse slides Nederlandse docent introduceert Engelse gast spreker Etc
Metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata WIE LEGT DIT VOORAF VAST? metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata
Metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata WIE LEGT DIT ACHTERAF VAST? metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata metadata
Wat zien we in de praktijk Automatisch geroosterde opnames van 4 of soms 9 uur Meerdere sprekers in 1 opname Pauzes in de opnames Docenten die tijdens de pauze mails beantwoorden op de presentatie PC (want de beamer staat toch uit!?!)
Praktijk testje
Onze conclusies Bulk toepassen van ASR is niet realistisch door ontbreken van of onjuiste metadata Indien ondertitels gemaakt moeten worden uit ASR is nabewerking nodig. Na automatisch vertalen van een ondertitel (NL) naar ander taal (EN) is nabewerking nodig
CC Closed Captioning Ondertiteling
Soorten en (For)maten
Tools
Presentations2Go SRT per taal
Kies de juiste taal in de player
Voorbeeld in de player
Ondertitels worden geïndexeerd
Google translate version of: I will survive
O.W. Vonder ovonder@presentations2go.eu