Gestigenkänning

Från Rilpedia

Hoppa till: navigering, sök
Wikipedia_letter_w.pngTexten från svenska WikipediaWikipedialogo_12pt.gif
rpsv.header.diskuteraikon2.gif

Gestigenkänning är ett område inom språkteknologi som syftar på att automatiskt avläsa och fastställa innebörden hos mänskliga gester, och ger möjlighet till en multimodal interaktion (via flera kanaler) med en dator. Traditionellt har gestigenkänning applicerats på gester utförda med händer och fingrar, men även gester via ansiktsuttryck och kroppshållning / kroppspråk har utforskats.

Avläsning av gester sker antingen optiskt med hjälp av kameror eller med hjälp av redskap som agerar som en förlängning av kroppsdelen.

Exempelområden inom gestigenkänning:

  • Rörelsekommandon i spel
  • Automatisk avläsning av Teckenspråk
  • Ökad tillgänglighet vid funktionshinder
  • Automatisk läppläsning
  • Musgester

Vid kamerabaserad gestigenkänning analyseras bilden med hjälp av datorseende-algoritmer för att fastställa gestens natur. Problem som kan uppstå är att bildbrus och även andra samtida rörelser kan störa avgörandet, samt att gester framför andra objekt kan vara svåra att avläsa.

På senare tid har ett flertal applikationer av redskapsbaserad gestigenkänning m.h.a Nintendo Wiis accelerometer-försedda fjärrkontroll framtagits.[1] [2] Ett problem som föreligger vid gestigenkänning är det s.k. segmenteringsproblemet, d.v.s. var börjar och slutar en gest? Vid redskapsbaserad gestigenkänning kan problemet i viss mån undvikas genom att utföraren själv markerar början och slut, exempelvis genom att hålla nere en knapp, men förslag finns på lösningar som opererar på en kontinuerlig ström av data.[3]

Vid avgörande av en gests innebörd används matematiska formalismer, vanligen statistiska sådana såsom dolda Markovmodeller[2] eller artificiella neurala nätverk[4], men även tillståndsmaskiner[1] samt dynamisk programmering[5] har visats kapabla.

Se även

Externa länkar

  • SignWiiver--Ett gestigenkänningssystem som använder en Nintendo Wii-kontroll som accelerometer
  • Tricom Solutions--Kommersiell gestigenkänning


Referenser

  1. 1,0 1,1 Per Malmestig och Sofie Sundberg, SignWiiver - en implementation av teckenspråkteknologi
  2. 2,0 2,1 Thomas Schlomer, Benjamin Poppinga, Niels Henze, Susanne Boll, Gesture Recognition with a Wii Controller, Proceedings of the 2nd international Conference on Tangible and Embedded interaction, 2008
  3. Ernhagen, Joakim, Artificiella neurala nätverk som lösning på segmenteringsproblemet vid gestigenkänning
  4. S. S. Fels and G. E. Hinton, Glove-TalkII - A Neural-Network Interface which Maps Gestures to Parallel Formant Speech Synthesizer Controls, IEEE Transactions on Neural Networks, September 1997, s. 977-984
  5. Seki, Kojima, Nagaya and Oka: Efficient gesture recognition algorithm based of Continuous Dynamic Programming, Proc. of RWC Symposium Technical Report, 1995, s. 47-48.
Personliga verktyg