Zaczynamy !!

Na dzisiejszym spotkaniu ściągnęliśmy pierwszą bazę treningową,  Wybraliśmy bazę zdjęć Cohn-Kanade.

SPOSÓB REALIZACJI

Na razie rozważyliśmy 2 koncepcje:

  1. Dane wejściowe przetwarzamy dwustopniowo:
    a) Określamy pozycję punktów charakterystycznych twarzy za pomocą narzędzi graficznych. Otrzymujemy wektor liczb zmiennoprzecinkowych.
    b) Otrzymany wynik traktujemy jako wektor cech będący wejściem klasycznej sieci głębokiej typu feed-forward (czyli takiej normalnej – omawialiśmy jej działanie na poprzednich zajęciach). Sieć zwraca najlepszą jej zdaniem emocję.
  2.  Dane wejściowe w formie czarno-białej są podawane bezpośrednio na wejście sieci konwolucyjnej (ze względu na lepsze przystosowanie sieci konwolucyjnych do znajdowania wzorców na obrazach). Sieć zwraca najlepszą jej zdaniem emocję.

PODSUMOWANIE

Możemy zrealizować niezależnie oba pomysły i porównać wyniki. Na razie należy przede wszystkim przystosować dane do treningu dla jednego albo obu pomysłów.

Leave a Reply

Your email address will not be published. Required fields are marked *