VERSLAG PRACTICUM 6 Pattern Recognition. PCA



Vergelijkbare documenten
Theoretische elektriciteit 5TSO

LOGBOEK van: klas: 1

2. Metingen aan RLC componenten

EVALUATIE TER STATE. Marion Matthijssen, Marn van Rhee. Centrum voor Onderzoek en Statistiek (COS) juli In opdracht van Raad van State

Inloggen. Nieuwsbrieven. Nieuwe nieuwsbrief aanmaken. Snippet

Huiswerk Informatie voor alle ouders

Schade protocol Zuiderpark Stadswalzone

Intervisiemethodes. In andermans schoenen methode. Incidentenmethode. Kernmodel intervisiemethode. Roddelmethode. Leren van elkaars succes methode

In dit hoofdstuk proberen we u uit te leggen hoe onze webshop functioneert.

IWI. De Gemeenteraad Postbus 11563

Het Muiswerkprogramma Basisgrammatica bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

Plaatsingsrichtlijnen Dr. Nassau College

HANDLEIDING PADLET UCLL. JOKE JORISSEN Informatica economie

Beleidsplan directe instructie : 1. Verantwoording 2. Doelstellingen 3. Model 4. Kijkwijzer 5. -Werkwijze en tijdsplanning.

Getallen 1 is een programma voor het aanleren van de basis rekenvaardigheden (getalbegrip).

Prospectbeheer : Te exporteren adressen

PET/CT scan met koolhydraatarm dieet

Instructie voor de PowerPointpresentatie voor Duits

Opdracht 1: Onderzoek naar protocollen persoonlijke verzorging.

Muiswerk Verhoudingen 1 bestrijkt de basisvaardigheden van het rekenen met verhoudingen, breuken en procenten.

TOELICHTING KOSTEN MOZAÏEKBEHEER OPEN GRASLAND

Evaluatie zorgleefplan met cliënt thuis en in het verzorgingshuis

Analytische boekhouding

Tussen een lichtbron en een scherm staat een voorwerp. Daardoor ontstaat een schaduw van het voorwerp op het scherm. lichtbron

BELANGENVERENIGING PENSIOENGERECHTIGDEN PFZW KEUZEMOGELIJKHEID TUSSEN LAAG-PENSIOEN

Web camera CAM44U/CAM55U/CAM66U. PC Camera

Bingo (spel) Uit Wikipedia, de vrije encyclopedie

Analyse Besluit Emissiearme Huisvesting en de Peel

Projectaanvraag Versterking sociale infrastructuur t.b.v. burgerkracht in Fryslân

Saxionstudent.nl CE 1

Veel gestelde vragen huurbeleid 18 oktober 2012

Neem deze kijkwijzer eerst goed door op school. Als er nog vragen zijn, stel die dan nog!

VZ-B-K1-W1-B Ondersteunt bij het voeren van de regie bij wonen en huishouden

Hardware Practicum Informatica klas 4

Muiswerk Studievaardigheid richt zich op de belangrijkste deelvaardigheden die nodig zijn voor studievaardigheid.

HANDLEIDING ROBO ROBO

Presenteren met behulp van Microsoft PowerPoint

Beschermd Wonen met een pgb onder verantwoordelijkheid van gemeenten

Module 5 Uitwerkingen van de opdrachten

Korte uitleg PIXresizer

Beschrijving S-Flex Voorraadimport

Microsoft Excel 2013 Basis

Vrijwilligersbeleid voetbalvereniging N.B.S.V.V.

5 Vectoren in de ruimte

Les Hernieuwbare energie

Beleidsregels voorziening jobcoaching Participatiewet 2015

STUDIEVAARDIGHEID OP MAAT

Verbanden 3. Doelgroep Verbanden 3. Omschrijving Verbanden 3

Bergermeer Gasopslag Microseismisch monitoring

Voorbeeldvragen Methodiek NEN 2767

Voorbeeld oefentypes online e-learningmodules CommArt Int.

2 Overgangen en tekstelementen toevoegen en opmaken

Dankzij de formulieren kan de gebruiker van de site informatie invoeren en versturen.

VWO-I CENTRALE EXAMENCOMMISSIE VASTSTELLING OPGAVEN CORRECTIEVOORSCHRIFT. Bij het examen: NATUURKUNDE VWO 1986-I. 2 Scoringsvoorschrift

Handleiding. Het opstellen van een diaconaal beleidsplan

Onderwerp Wijziging van de Verordening tot het kunnen verlenen van een alleenrecht voor Concern voor Werk. Aan de raad. Status: ter besluitvorming

Projectformulier ten behoeve van Openbare Instellingen

6 verschillende systemen derdebetaler

Met behulp van Muiswerk Begrijpend Lezen 2 leren leerlingen informatie, betekenissen en bedoelingen uit teksten te halen.

Muiswerk Verbanden 2 besteedt aandacht aan het rekenen met grafieken en tabellen.

Dyslexie, Dyscalculie & Spellingsbegeleiding

Bij leefbaarheid gaat het er om hoe mensen hun omgeving ervaren en beoordelen.

Opleiding. Elektromechanica. Code + officiële benaming van de module. C5 Digitale combinatorische schakelingen. Academiejaar

Addendum stappenplan plaatsing

Let op!! Niet zwemmen i.v.m. blauwalg. Leerdoelen: Kerndoelen Curriculum watereducatie SLO: NME leergebied: Werkvormen: Vakgebied: Niveau: Tijdsduur:

Lesbeschrijving. Havens aan de Schelde. Aan de hand van deze 3 lessen maken de leerlingen kennis met de dieren die in en om de Schelde leven

ALGEMENE VOORWAARDEN BEN KORTMAN COMMUNICATIE/FOTOGRAFIE

Verandertrajecten voor individuele medewerkers

Inleiding. Wij verwachten u op: Datum: Tijdstip:

prijsaanvraag 'Kruidlaag in Woodland' - inlichtingenformulier -

Ace! Training E-learning module 'vragen stellen' Cursus communicatievaardigheden 1

Doelgroepen Dit educatieve lespakket is bedoeld voor de groepen 5,6 en de groepen 7,8.

Verbeterplan Begrijpend luisteren en Begrijpend lezen

Het veilingbedrijf Wie leveren de bloemen en planten aan de veiling? Wie mag er kopen op de veiling? Het veilen

Opbrengsten VSO Panta Rhei College schooljaar

Een natuurlijk proces

Hoe oud is dat? Lessenserie over archeologie voor groep 3/4/5 Gebaseerd op de didactiek van onderzoekend en ontwerpend leren

Microsoft Excel Basis AAN DE SLAG MET DIGITALE VAARDIGHEDEN TRAINING: MICROSOFT EXCEL 2010 BASIS

Transcriptie:

VERSLAG PRACTICUM 6 Pattern Recgnitin. PCA Niclaas Heyning 0152447 Sjerd kerkstra 0445061 Inleiding Bij deze pdracht is het de bedeling de werking van Principal Cmpnent Analyse (PCA) te bestuderen. Er wrden twee verschillende PCA methdes geïmplementeerd en getest p een dataset met ft s van gezichten. Dataset De faces dataset bestaat uit 20 * 28 zwart wit ft s van gezichten. Er zijn 1965 verschillende ft's. Iedere pixel in een ft wrdt bij het tepassen van PCA pgevat als een dimensie. Het aantal dimensies is dus 20*28 = 560 dimensies. Therie De gebruikelijke methde vr het uitrekenen van principale cmpnenten is het vinden van de eigen vectren van de cvariantie matrix van data matrix X. Vr data met een gemiddelde van 0 kmt dit vereen met het berekenen van de eigen vectren van C = X T X. De ntleding van C ziet er dan als vlgt uit: C = WMW T. Hierbij staat W vr de eigen vectren en M vr de eigen waarden. Er is echter ng een methde m de principale cmpnenten te achterhalen: de in-prduct matrix T = XX T. hierbij is de eigen decmpsitie T = VAV T. De eigen vectren van C

(de klmmen van W) kunnen vervlgens achterhaald wrden dr de eigenvectren van T links met X T te vermenigvuldigen. Exercise: (a) Tussen eigen vectren w van C en v van T geldt de vlgende relatie: w = X T v. De relatie tussen de eigen waarden m van C en a van T geldt dan de relatie: X T m = a. als v een eigenvectr is, is rv k een eigen vectr, mdat een eigen vectr een richting in N dimentinale ruimte aangeeft (met N = het aantal dimenties van de data) en de grtte niet van belang is. De eigen waarden van een eigen vectr v zal echter r keer z klein zijn. Eigenvectrs f images Er zijn twee verschillende PCA methden geïmplementeerd in matlab; pca_t en pca_c. pca_c berekent de eigen vectren van de cvariantie matrix, en pca_t gebruikt het inprduct. Een belangrijk verschil tussen de twee methden is het vlgende: Stel ene data matrix X met dimensies n x d. Vr het berekenen van de cvariantie (X T X) meten d * d vermenigvuldigingen uitgeverd wrden. Vr het berekenen van het in-prduct (XX T ) zijn n * n peraties ndig. Bij de keuze tussen de methden pca_c en pca_t is dus de verhuding tussen het aantal datapunten en het aantal dimensies van belang. Bij meer datapunten dan dimensies is het handiger m de cvariantie (pca_c) te berekenen. In het geval van de faces dataset is het efficiënter m pca_c te gebruiken mdat deze dataset 1965 datapunten bevat en 560 dimensies. Een plt van de eerste 9 eigen vectren die gevnden zijn in de faces dataset.

De eigen faces representeren eigen vectren in een 560 dimensinale ruimte. In de richting van deze vectren hebben de datapunten een maximale variantie. In de beeldruimte kunnen de eigen faces als vlgt pgevat wrden: de eigen waarde van eigen face 1 geeft van alle eigen faces de meest infrmatieve infrmatie. Daarna is de eigen waarde van eigen face 2 het meest infrmatief enzvrt. De elementen die zichtbaar zijn in eigen face 1 verschillen dus veel binnen de dataset. Het mixen van de eerste 5 eigen faces met het gemiddelde gezicht uit de faces dataset.

In de afbeelding is te zien he de eerste 5 eigen vectren het gemiddelde gezicht mdificeren. In de derde klm is het gemiddelde gezicht te zien. De rijen representeren de eerste 5 eigen faces. Links van de derde klm wrden de eigen faces respectievelijk 1 en 2 keer van het gemiddelde afgetrkken. Naar rechts wrdt er pgeteld. Per vectr (eigen face) zijn er duidelijk verschillende eigenschappen van de dataset te nderscheiden. De eerste eigen vectr representeert de rtatie van het gezicht. De tweede de sterke van de schaduwen bij mnd en gen. De derde de vrm van de mnd (lachen f niet). De vierde de verticale beweging van het hfd. De vijfde eigen vectr lijkt de helderheid en het cntrast en k de afstand van het gezicht tt de lens te representeren. 5 plaatjes van gezichten uit de dataset (links) en hun recnstructie dr alleen de eerste 9 eigen vectren te gebruiken.

Opvallend is te zien he ged een gezicht te recnstrueren is met slechts de eerste 9 van de 560 eigen vectren. Als de eigen vectren eenmaal bekend zijn vr de dataset

is het dus mgelijk m een plaatje redelijk ged te representeren met slechts 9 eigen waarden. Dit is een enrme data reductie ten pzichte van de 560 pixel waarden die znder PCA ndig zijn. een plt van de eerste 50 eigen waarden Het is duidelijk te zien dat het vergrte deel van de infrmatie gepresenteerd kan wrden met een klein aantal eigen vectren. Dit is te zien aan de snelle afname in de grafiek. het percentage variantie dat dr de eerste 9 PCA dimensies gerepresenteerd wrdt berekend

In deze grafiek is een zelfde srt verlp te zien als in de eigen waarde plt hierbven; de eerste eigen values bevatte een grt deel van de infrmatie. In de grafiek is te zien dat de eerste vijf eigen vectren meer dan de helft van de variantie representeren, en de eerste 50 eigen vectren meer dan 90 prcent kunnen representeren. Cnclusies In dit practicum is er geëxperimenteerd met PCA. Op het gezichtherkennings dmein lijkt deze methde een zeer efficiëntie datareductie te bewerkstelligen. Uit experimenten met de faces dataset is gebleken dat een gezicht zeer redelijk te recnstrueren is dr gebruik te maken van ng geen 2 prcent van de data ruimte. Een vrwaarde hiervr is wel dat eerst de eerste n eigen vectren vr de hele dataset berekend wrden. Deze eigen vectren gelden echter vr alle gezichten in de dataset. He meer gezichten er in de dataset zitten, he efficiënter deze met PCA gerepresenteerd kunnen wrden. PCA is dr de datareductie erg geschikt vr data analyse waarbij snelheid van belang is.