Artificial intelligence & …
Oktober 2, 2019
Unser Dozent, Steffen Konrath, Gründer von AI Suisse, hat uns auf eine spannende Reise der Artificial intelligence (AI) Anwendungen mitgenommen. Nebst einer eindrücklichen Sammlung von Beispielen aller KI Kategorien haben wir diverse Use-Cases in kleinen Gruppen aufgearbeitet.
AI in Grossfirmen werden Grossteiles noch immer als “Versuch” angesehen, da die Resultate nicht immer klar erkennbar sind. Es ist essentiell dass die Firma weiss, was sie mit der AI erreichen /vergleichen will. Nicht jede Anpassung muss zwingend AI basiert sein. Oft reicht auch schon eine gute Datenbank. Zudem braucht AI Markenerfahrung um erfolgreich zu sein.
Wichtig ist zu erkennen, wie das System weiterlernt und welche Aufgaben weiterhin von Menschen ausgeführt werden. Am Ende zählt immer die Frage: Rechnet sich das, was wir vorhaben?
Proof of Concept= ein Meilenstein, an dem die prinzipielle Durchführbarkeit eines Vorhabens dokumentiert ist.
80% aller AI Probleme sind Datenprobleme – AI is only as great as the pattern we teach it!
Accuracy = ist das Erfolgskriterium bei der Durchführung sämtlicher Projekte. Genauigkeit , Sorgfalt, Gründlichkeit, Richtigkeit, Zielgerichtetheit, Übereinstimmung in finanziellen, menschlichen wie Projektbezogenen Kriterien sind unumgänglich.
Record Future: Zu den Investoren von RF zählen Google und die CIA. Bei RF werden öffentlichen Informationen aus dem Netz Cyberattacken und Unruhen vorhersagt
Die Chatbot sind noch immer der top Favorit für Firmen, um in das AI Thema einzusteigen. Man unterscheidet regelbasierter – oder KI basierter Chatbots.
Narrow AI (schwache AI ) – der “Fachidiot” (= werden Systeme bezeichnet, die sich auf die Lösung konkreter Anwendungsprobleme fokussieren)
Beispiele: Bilderkennung, Spracherkennung, Automatisierte Übersetzung, Navi, Zeichen– und Textverarbeitung
General AI (starke AI) – die Zukunft (= die gleichen intellektuellen Fertigkeiten von Menschen zu erlangen oder zu übertreffen)
Augmented Reality
= versteht man die computergestützte Erweiterung der Realitätswahrnehmung. Diese Information kann alle menschlichen Sinne ansprechen. Häufig wird jedoch unter erweiterter Realität nur die visuelle Darstellung von Informationen verstanden. Die Menschen sind hier noch immer im Mittelpunkt – Ethische Frage – wo ersetzen wir den Menschen, wo macht es Sinn?
Beispiele: Bei Fußball-Übertragungen ist erweiterte Realität beispielsweise das Einblenden von Entfernungen bei Freistößen mithilfe eines Kreises oder einer Linie.
NLU (Natural Language Understanding) oder LDV ( Linguistische Datenverarbeitung)
= hier wird grundsätzlich die Inhaltsanalyse (Verstehen eines Textes zusammengefasst)
NLG (Natural Language Generation)
= ist eine natürlich sprachliche Textgenerierung, bei der aus Datensätzen automatisch Texte oder Sprache generiert wird. Das NLG-Verfahren unterstützt die Computerlinguistik, es arbeitet mit AI.
NLU und NLP dienen der beidseitigen Interaktion zwischen Menschen und Maschinen. Die verfassten Texte entsprechen denen der menschlichen Ausdrucksweise.
Anwendungen
News / Kommentare auf Webpage / Webseiten Automatisierung / Schreiben von Zusammenfassungen/ Real time Übersetzungen / Open AI / Recruiting Process Chatbots
Für die saubere Projektdefinition wird uns das CANVAS Framework von Prolego empfohlen
Typischerweise wird AI im Textbereich für Suchmaschinen, das automatische Klassifizieren/Bewerten von Texten, in der Übersetzung oder auch in Artikelgenerierung verwendet.
Language (real time) translation
Eine Weiterentwicklung der Facebook (FB) AI Technologie hat das Unternehmen an die Macht gebracht. 50% der FB Benützer sprechen kein Englisch und die meisten haben keine gemeinsame Sprache. 4,5 Milliarden Übersetzungen pro Tag werden durch das neue Übersetzungssystem von FB erstellt. Ihr Ziel, das alle User FB in ihrer bevorzugtem Sprache nützen können.
Perspective .ai.
Von Google und Jigsaw entwickelte, auf maschinellem Lernen basierendes Moderationstool, welches einige Kommentare automatisch genehmigt und Moderatoren dabei hilft, sich schneller durch andere zu wühlen, indem es Millionen von Kommentaren aus Wikipedia-Redaktionsdiskussionen, der New York Times, dem Internet und andere unbenannte Partner entnimmt und über eine Sentiment-Analyse Textfragmente (Bsp. Kommentare, ob sie negativ, beleidigend, kritisch, etc.) prüft.
Sentiment – Analyse = hat das Ziel, die Wahrnehmung (Polarität) eines Textes oder Tokens zu quantifizieren. Es wird demnach analysiert, ob der Text im Allgemeinen als positiv (Wörter wie z.B. “Glück”) oder negativ (z.B. “Verrat”) wahrgenommen wird oder eher neutral ist.
Großer Datensatz für Trainings und bewerte Zusammenfassungssysteme. Es enthält 1.3 Millionen Artikel und Zusammenfassungen von Autoren und Herausgeber in der Nachrichtenredaktionen von 38 wichtige Veröffentlichungen.
Augmented Journalisms (a newspaper assembled by robots – in Tokyo)
Der Shinano Mainichi Shimbun hat zusammen mit Fujitsu, Japans größtem IT-Dienstleistungsunternehmen, die Software entwickelt, die auf der von Fujitsu Laboratories entwickelten Technologie basiert. Die Mitarbeiter des Broadsheets haben Zusammenfassungen manuell erstellt, was pro Artikel bis zu fünf Minuten dauert. Die Software erstellt sofort und mit größter Genauigkeit Zusammenfassungen, die mit dem Anhaltspunkt beginnt und endet, wenn der das Wortlimit ist erreicht.
GPT2
Ist ein Textgenerator. Dem Al-System wird Text zugeführt, von einigen Wörtern bis zu einer ganzen Seite Die Maschine schreibt dann die nächsten paar Sätze weiter, auf der Grundlage seiner Vorhersagen/Erfahrungen/Muster. Das System pushed die Grenzen dessen, was für möglich gehalten wurde, sowohl in Bezug auf die Qualität des Outputs als auch auf die Vielfalt der potentiellen Verwendungen. Aber Achtung…wo eine Maschine selber schreibt kann auch Fake News entstehen
Chatbots in the recruiting Industry
Alle möglichen Daten/Fragen /Antworten die während eines Interview Prozesses vorkommen könnten müssen gesammelt werden und der Maschine beigebracht werden. Dies z.Z. noch regelbasiert, das KI basiert zu aufwändig wäre.
!!! Wenn neben den Maschinen noch Menschen im Prozess involviert sind, gibt es keine KI!!!
Recruting Chatbots sind 5x schnellere Interview Planungszeit / 30% Reduktion bei den Anstellungskosten / 75% weniger Zeit bei der Kandidatensuche / 20% Zeitersparnis pro Woche
Chatbots in Marketing (intelligenter Kühlschrank)
Brauchen wir noch Marketingleute, wenn wir den Einkauf / Lieferung von Produkten automatisieren können? Und zusätzlich Vorteile wie Kostenersparnis, höhere Relevanz, bessere Benutzerfreundlichkeit haben?
AI wird zudem auch zur Generierung von Tönen/Video verwendet. Von einem gegebenen Video, kann eine Maschine Objekte/ Bilder/Szenen anhand vom Ton/Klang erkennen /erahnen.
Erkennung von Objekten/Bilder/Szenen anhand vom Tönen
Die Vorhersage auf das Objekt kann sich im Verlaufe des Trainings ändern (Maschinen werden anhand von Mustern trainiert). Daher ist essentiell zu wissen was man sucht, damit die Maschine richtig trainiert werden kann.
Gesichter anhand von Stimmen kreieren
Durch die Analyse nur eines kurzen Audioclips einer Person wird rekonstruiert, wie sie im wirklichen Leben aussehen könnte.
Die Methode kann die wahre Identität einer Person nicht anhand ihrer Stimme rekonstruieren (Bsp. genaues Bild vom Gesichts). Dies liegt daran, dass das Modell trainiert ist visuelle Merkmale festzuhalten (e.g. Alter, Herkunft, Geschlecht, usw.) was auf viele Personen zurückzuführen kann. Das Modell erzeugt daher nur durchschnittlich gute Bilder von Gesichtern mit charakteristischen visuellen Merkmalen, die mit der eingegebenen Sprache korrelieren und keine Bilder von bestimmten Personen!
Das Paradebeispiel der AI, die Bilderkennung. Heute kann eine Maschine Bilder auch hoch verpixelt erkennen.
Understanding Image Content
Beispiel: Storyful aus Dublin hat das eine Erfahrungen gemacht
Die Systeme sind noch nicht perfekt: 1. Problem) die Antwort die eine Maschine uns gibt ist basierend auf einen Bereich. 2. Problem) Der grosse Unterschied zw. Mensch und Maschine: Die menschliche Erfahrung ist kumulativ und kontextuell und hilft uns, die Funktionsweise der Welt besser zu verstehen. AI Maschinen hingegen sind für eine isolierte Aufgabe konzipiert: Schach spielen oder Gesichter erkennen (=”Fachidiot”)
Al verwendet, um die Filmqualität und das Zuschauer Erlebnis zu verbessern
Beispielsweise hat im Juli 2017 Pixar Animation und die University of California, Santa Barbara, zusammengearbeitet, um Bildrauschen in Filmen zu beseitigen (oder Abweichungen in der Helligkeit oder Farbbildung). Diese Herausforderung wurde mit Hilfe von Deep Learning ( DL) gemeistert.
Eine Maschine kann aus Text Bilder entstehen lassen (Bsp. Suchbegriff in Google Search: Gelber folge auf Ast). Die Maschine sucht diverse Bilder (von Ästen& Vögeln) und matched diese.
Ist der nächste Picasso ein Roboter?
AI ist bereits ein Vorreiter in der Kunstbranche. Das renommierte Auktionshaus Christie’s hat kürzlich bekannt gegeben, dass es die erste vollständig von Al entworfene Kollektion verkaufen wird
Bilder erzeugen und deren Auswirkung auf die Werbung
Die Schaffung von KI wirft schwerwiegende ethische Fragen auf bringt jedoch eine hohe Identifikation und Einsparungen mit sich.
Objekt Erkennung – bewegte Bilder
Beispiel: Anhand von Auto-Kleinanzeigen in einem regional Blatt, diese analysieren und feststellen, was für ein Life Style die Leute in diesem Quartier haben könnten
A new method for creating high-resolution photo-realistic images from semantic label maps using conditional generative adversarial networks (conditional GANs). Conditional GANs have enabled a variety of applications, but the results are often limited to low-resolution and still far from realistic. We generate 2048×1024 visually appealing results with a novel adversarial loss, as well as new multi-scale generator and discriminator architectures. Furthermore, we extend our framework to interactive visual manipulation with two additional features. First, we incorporate object instance segmentation information, which enables object manipulations such as removing/adding objects and changing the object category. Second, we propose a method to generate diverse results given the same input, allowing users to edit the object appearance interactively. Human opinion studies demonstrate that our method significantly outperforms existing methods, advancing both the quality and the resolution of deep image synthesis and editing.
Unbemannte Fahrzeuge & Präzision-Landwirtschaft
Beispiele
Drohen Bilder schauen auf dem Gelände wo zum Beispiel Schäden an Häuser vorzufinden sind.
Drohnen fliegen über Ackerfelder oder Golfplätzen und informieren wo noch handangelegt werden muss.
And the Oscar goes to…
Der Filmemacher Oscar Sharp wandte sich an seinen Technologen Ross Goodwin, um eine Maschine zu bauen, mit der Drehbücher geschrieben werden können. Die Maschine kreiert “Jetson” und versorgten diesen mit Hunderten von Science-Fiction-TV- und Filmskripten. Durch das analysieren der visuellen Elemente der Filme konnte der Algrothmus die “Tränendrüsen” Momente definieren und vorhersagen, wie der gesamte emotionale Bogen der Geschichte sich entwickeln wird. Die Forscher verwendeten auch Freiwillige (menschlich) “Kontrollgruppe”, um ihre Reaktion auf einige von Computern analysierte Filme abzubilden, und verwendeten diese Daten, um ihre Modelle zu verfeinern.
Real “fake news” Video
Der New Yorker speiste 270.000 von Trump gesprochene Wörter in ein Computerprogramm ein, welches Sprachmuster studiert. Dieses System analysierte seine Wortwahl, Gestik und Grammatik und lernte, wie man Trumps Sprache simuliert. Gefährlich wird es bei sogenannten Deepfakes.
Wenn selbst fahrende Autos übernehmen wenn wir abgelenkt sind
Ein teilautonomes Fahrzeug fährt auf einer Teststrecke. Was passiert, wenn der Fahrer zu sehr abgelenkt ist? In diesem Fall wir das Fahrzeug fragen, ob es die Kontrolle übernehmen soll.
Beispiel von Video AI in Unternehmen
Suizid Prävention an Bahnhöfen beim Einfahren vom Zug, Gebäudezutritt (durch Gesichtserkennung), Video Meeting, Überwachung von Baustellen, etc.
Suchergebnisse, resultierend aus dem Verhalten sind “nicht biased/verzerrt”
Google Search macht stark Gebrauch von Machine Learning, um die Antworten auf die meisten Suchanfragen zu liefern,
Während des Präsidenten Wahlen in den USA im Jahr 2016 hatte die Maschine festgestellt, dass Personen, die nach “Obama” suchten, mehr Obama-Ergebnisse in der Folgesuche wollten, während diejenigen, die nach Romney suchten, dies nicht wollten. Aus diesem Grund findet man in den von Google angebotenen folgenden Suchergebnissen kaum Romney-Links.
Was nach einem Bias für Journalisten aussieht ist keines für die “Search-Funktion”
AI is only as great as the pattern wie teach it! Was passiert, wenn wir der Maschine Informationen lernen, die voreingenommene oder gar rassistische sind?
Maschinen können sich mit Hilfe von Forschung und Trainings verbessern. Beim Lernen werden viele Wiederholungen gemacht, um schneller und besser zu werden -> Lernen = Belohnung
Ein Roboter lernt automatisch weiterzulaufen nachdem er beschädigt wurde indem er von einer eine grosse Karte vom Raum gebraucht macht, diversen Gangarten testet und deren Leistungswert. Learning by doing!
Beispiel: Der Roboter im Video hat sein vorderes, rechts Bein gebrochen. Um trotz “Verletzung” weiterlaufen zu können macht er Gebrauch von einer neu erfundenen “Intelligenz” – Try & Error Algorithmus”, welcher ein Verhalten des Roboters auswählt, welcher er annimmt, dass der Roboter als nächstes ausführen wird basierend auf vorherige (simuliert) Erfahrung
Maschinen lernen zu kooperieren um ihre Ziele zu erreichen
Automatisiertes Verhaltensmuster – Roboter geht auf ein für ihn unbekanntes Gelände wo er nicht weiss was ihn erwartet und lernt vor Ort mit Herausforderungen zu wachsen
Massgeschneidertes Sprachenlernen – elearning
Sprachsoftware, die mit Übersetzungen oder Mustertrainings funktioniert sind einfacher zu modellieren. Die Spracherkennung kann durch unklare Aussprache, Flüstern oder Hintergrundgeräusche beeinflusst oder von Lernenden absichtlich getäuscht werden Die Dialogfunktion ist ein Versuch, die natürliche verbale Interaktion zu simulieren: Dialogsysteme mit komplexen Avataren, die selbst Gestik und Mimik beherrschen, sowie, die Analyse großer Datenmengen via Algorithmen und statistische Modelle kann auch für den Fremdsprachenunterricht genutzt werden
Der “Listening Table” ist ein Möbelstück welches hören und die Gespräche welche am Tisch stattfinden verstehen kann
Beispiel:
Alexa for the Office
Speech to Text, Texterkennung (NLP), Features (To Do’s, Entscheide, Zusammenfassungen, Profile mit Suchfunktion, messen der Teamstimmung, Differenzierung der Mikrofone
AI & Facility Management
Handbücher, fürs messen von Licht, Wasser, etc.
Understanding Image Content
Ein Team von Microsoft Research/Carneige Mellon University haben ein System kreiert welches mit Hilfe von Computer Vision, Dee Learning, Sprachverständnis, Bilder und Fragestellungen analysiert wie dies menschliche Wesen machen würden.
Die Fähigkeit auf Fragen zu antworten ist entscheidend für die Weiterentwicklung von KI Tools und dieser Durchbruch könnte zu Echtzeit Empfehlungen/Aktionen führen welche menschliche Bedürfnisse vorhersehen.
Panama Papers & Big Data
Im Fall “Panama Papers” lag die Gesamtmenge der durchgesickerten Daten bei 2,6 Terabyte (TB). Nur 22 Megabyte (MB) haben es jedoch in die endgültige Datenbank geschafft, die in den meisten Veröffentlichungen verwendet wurde.
Um dies zu relativieren, stellen wir uns vor, 1 MB = 1 Cent wert //1 TB = € 10.000. Daher nur von den 26.000 € verfügbaren Informationen, wurden nur 22 Cent tatsächlich in der Datenbank veröffentlicht.
Persönlichkeitstypen (mehr mitfühlend sein)
Persönlichkeitsunterschiede sind Facts und die Al kann uns helfen, Persönlichkeitstypen zu erkennen und aufzeigen, wie sie kommunizieren, was sie motiviert und wie wäre, wenn sie zusammenzuarbeiten würden?
Beispiele: Meyers-Briggs Type Indicator // DISC assessment
Beide Tests sind überwiegend ergebnisorientiert weniger Prozessorientiert
Facebook
Ein neues Facebook-Patent wurde entdeckt, welches zeigt, wie Facebook aufgrund von wahrnehmbaren Variablen zu dem Schluss kommt, dass jemand der Mittelklasse angehört
Körperposition verstehen
Aufgaben der menschlichen Wahrnehmung von links nach rechts mit zunehmender Komplexität
Maschine definiert fixe punkte bei einer Person, die zum Bsp am Steuer sitzt, bei Veränderung der Position, kann das System ein Signal von sich geben um den Lenker zu warnen.
Als Faustregel gilt: Alles was kleiner wird, wird immer schwieriger zu identifizieren.
Kognitive Belastbarkeit
Wie konzentriert sind Menschen in Verkehrssituationen oder beim Fahren? Kognitive Belastung misst den (mangelnden) Fokus der Menschen.
Die Pupillenbewegung wurde verwendet, um den Fokus der Menschen zu bestimmen. Der Kreis ist schmaler und kleiner, wenn die Augen auf ein Objekt gerichtet sind. Eine schnellere Pupillenbewegung ist ein Indikator für kognitive Belastung
Kognitive Computing in Sports (Sportjournalismus)
Durch die Kombination von historischen Daten, Massenreaktionen und Mimik der Spieler, kann IBM Watson eine Rangliste der besten Schüsse/Schläge eines Matches definiert/erstellen und unmittelbar nach dem Match in den “Day Highlight” wiedergeben.
Das System bewertet die Schläge aus sieben US Open Matches und kuratiert automatisch deren Highlights, was den Videoproduktionsprozess vereinfacht und letztendlich das USTA-Team ermöglicht, die Highlights in no time zu skalieren.
Highlighted Videos werden auf verschiedene Arten zur Verfügung gestellt: Veröffentlichung der Tages Highlights von Watson auf seiner FB Seite //Fans, die Spieler in den US Open-Apps “favorisieren” erhalten Push-Benachrichtigungen in Echtzeit über Höhepunkte dieser Spieler //Auf der Player-Bio Seite werden Video-Highlights angezeigt und für alle digitalen Plattformen der USTA verfügbar gemacht
Autoregressively generated music with Recurrent Neural Network (RNN)
Musik wurde autoregressiv kreiert, indem man ein RNN Beispiel kreiert welches auf Audio Rohdaten vom Album Mirrored by Battles trainiert ist. Die Maschine hörte über einige Tage 30x Mirrored an. 1300 Minuten Mono-Audio werden von der Maschine generiert. Ein “human Remixer” hörte sich alle Audiofiles an und kuratiert daraus einen 18 Minuten Song.
Mixed reality und neue Unterhaltungssysteme
Disney betreibt 3 Forschungslabore, welches auf die Forschungsbereichen: Machine Learning und Datenanalyse, Visual Computing, Robotik und Mensch-Computer-Interaktion spezialisiert hat
Magic Bench
Mixed & Augmented Reality Technologie wo ein User auf einer Parkbank sitzt und mit einem humanoid Tier spielt
Machine Learning
Spotting Hit Movies
ScriptBook (Roboterskriptleser) verwendet einen Algorithmus, der versucht, die besten Filme zu finden. Hollywood hat dies getastet: Die Hollywood-Studios gaben 32 von 62 Filmen ein falsches Rating, während ScriptBook 22 Filme aus diesem Pool korrekt als “Kassenfehler” identifizierten
Smart Selling
Zunahme der Vorlaufszeit/Termine von mehr als 50%/ Kostenermäßigungen von 40% – 60% / Anrufzeitverkürzungen von 60% -70% (1)
62% der führenden Verkäufer sind der Meinung, dass “Guided Selling” an Bedeutung gewinnen wird (2)
Bis 2020 werden 30% aller B2B Unternehmen AI für mindestens einer ihrer Sales-Prozesse einsetzen (3)
Top 3 AI / ML use Cases in Sales sind: Intelligente Vorhersage, Blick in die Kaufgelegenheiten und Lead-Priorisierung
Promption
Die Industrie ist noch nicht bereit für die fortschrittlichste Technologie. Obwohl neue Technologien die Handhabung vom komplexen Channel Management und die Optimierung für das Endergebnis verbessern könnte.
Generative Design – Product Marketing
Hier geht es darum optimierte Lösungen in einer komplexen Umgebung zu finden, an die man vielleicht normalerweise gar nicht denkt oder in Betracht gezogen hat: Benefits: Kosten, Material, Nachhaltigkeit, Machart
MX3D: 30 Printing a Bridge – smart sensory network (https://www.youtube.com/watch?v=v2moJF8kqIg )
MX3D ist ein 3D-Druck welcher eine voll funktionsfähigen Edelstahlbrücke “gedruckt” hat. Die Brücke überquert einen der ältesten und bekanntesten Kanäle im Zentrum von Amsterdam. Die Firma stattet typische Industrieroboter mit speziellen Werkzeugen aus und entwickeln die Software zu deren Steuerung. Dieser einzigartige Ansatz ermöglicht es, starke und komplexe u Strukturen aus Metall in 3D zu drucken. Ziel des MX3D Bridge-Projekts ist es, die potenziellen Anwendungen unserer mehrachsigen 3D-Drucktechnologie vorzustellen.
Automatisierte Logistik
Al erhöht die Effizienz in der Supply Chain. Ersetzt arbeiten, welche durch erhebliche Investitionen in Arbeitskräfte nicht gemacht werden konnten.
Beispiel automatisierte Logistik im Verteilerzentren: Über 4.500 Sendungen in einer Stunde mit doppelte Geschwindigkeit und mit einer Genauigkeit von 99,9%.
Unser Newsletter liefert dir brandaktuelle News, Insights aus unseren Studiengängen, inspirierende Tech- & Business-Events und spannende Job- und Projektausschreibungen, die die digitale Welt bewegen.