2Sep

Was ist "differenzielle Privatsphäre" und wie werden meine Daten anonymisiert?

Apple setzt sich dafür ein, dass die von Ihnen erfassten Daten privat bleiben. Wie? Indem Sie etwas namens "Differential Privacy" verwenden.

Was ist Differential Privacy?

Apple erklärt es so:

Apple nutzt die differenzielle Datenschutz-Technologie, um die Nutzungsmuster einer großen Anzahl von Benutzern zu ermitteln, ohne dabei die Privatsphäre zu gefährden. Um die Identität einer Person zu verschleiern, fügt Differential Privacy einem kleinen Muster des Nutzungsmusters der Person mathematisches Rauschen hinzu. Wenn mehr Menschen das gleiche Muster teilen, entstehen allgemeine Muster, die die Benutzererfahrung beeinflussen und verbessern können.

Die Philosophie hinter Differential Privacy ist folgende: Jeder Benutzer, dessen Gerät, ob iPhone, iPad oder Mac, eine Berechnung zu einem größeren Pool von Aggregatdaten hinzufügt( ein großes Bild, das aus variierenden kleineren Bildern besteht), sollte nicht aufgedeckt werdenals Quelle, geschweige denn, welche Daten sie beigetragen haben.

Apple ist nicht das einzige Unternehmen, das dies tut - sowohl Google als auch Microsoft nutzen es schon früher. Aber Apple hat es populär gemacht, indem es auf seiner WWDC-Keynote 2016 ausführlich darüber gesprochen hat.

Wie unterscheidet sich das von anderen anonymisierten Daten? Nun, anonymisierte Daten können immer noch verwendet werden, um persönliche Informationen abzuleiten, wenn Sie genug über eine Person wissen.

Nehmen wir an, ein Hacker kann auf eine anonymisierte Datenbank zugreifen, die die Gehaltsabrechnung eines Unternehmens anzeigt. Sagen wir, sie wissen auch, dass Mitarbeiter X in einen anderen Bereich umzieht. Der Hacker könnte dann einfach die Datenbank abfragen, bevor und nachdem sich Mitarbeiter X bewegt und sein Einkommen leicht ableiten kann.

Um sensible Informationen von Employee X zu schützen, ändert Differential Privacy die Daten mit mathematischem "Rauschen" und anderen Techniken. Wenn Sie die Datenbank abfragen, erhalten Sie nur eine -Näherung darüber, wie viel( oder jemand anderes) Mitarbeiter X warbezahlt.

Daher wird seine Privatsphäre aufgrund des "Unterschieds" zwischen den gelieferten Daten und dem hinzugefügten Rauschen bewahrt, so dass es dann vage genug ist, dass es praktisch unmöglich ist zu wissen, ob die Daten, die Sie betrachten, tatsächlich eine bestimmte Person sind.

Wie funktioniert die differenzielle Privatsphäre von Apple?

Differenzielle Privatsphäre ist ein relativ neues Konzept, aber die Idee ist, dass es ein Unternehmen geben kann, basierend auf Daten von seinen Benutzern, ohne zu wissen, was genau sagt oder von wem es stammt.

Apple setzt zum Beispiel drei Komponenten ein, um differenzielle Datenschutzmaßnahmen auf Ihrem Mac oder iOS-Gerät umzusetzen: Hashing, Subsampling und Rauschinjektion.

Hashing nimmt eine Textzeichenfolge und wandelt sie in einen kürzeren Wert mit einer festen Länge um und mischt diese Schlüssel in irreversibel zufällige Zeichenfolgen von eindeutigen Zeichen oder "Hash".Dies verdunkelt Ihre Daten, so dass das Gerät keine davon in seiner ursprünglichen Form speichert.

Subsampling bedeutet, dass Apple nicht jedes Wort einer Person sammelt, sondern nur eine kleinere Auswahl. Angenommen, Sie haben eine lange Textkonversation mit einem Freund, der großzügig Emoji verwendet. Anstatt die gesamte Konversation zu sammeln, kann das Subsampling stattdessen nur die Teile verwenden, an denen Apple interessiert ist, wie das Emoji.

Schließlich injiziert Ihr Gerät Rauschen und fügt zufällige Daten in das ursprüngliche Dataset ein, um es vage zu machen. Dies bedeutet, dass Apple ein Ergebnis erhält, das nur geringfügig maskiert wurde und daher nicht genau ist.

All dies passiert auf Ihrem Gerät, also wurde es bereits gekürzt, gemischt, gesampelt und verwischt, bevor es überhaupt in die Cloud geschickt wird, damit Apple es analysieren kann.

Wo wird die differentielle Privatsphäre von Apple verwendet?

Es gibt eine Vielzahl von Fällen, in denen der von Daten sammeln möchte, um seine Apps und Dienste zu verbessern. Im Moment nutzt Apple die differenzielle Privatsphäre nur in vier spezifischen Bereichen.

  • Wenn genug Leute ein Wort durch ein bestimmtes Emoji ersetzen, wird es ein Vorschlag für alle.
  • Wenn neue Wörter so vielen lokalen Wörterbüchern hinzugefügt werden, dass sie als alltäglich angesehen werden, fügt Apple sie auch dem Wörterbuch eines jeden anderen hinzu.
  • Sie können einen Suchbegriff in Spotlight verwenden, der dann App-Vorschläge bereitstellt und diesen Link in der App öffnet oder Ihnen die Installation im App Store ermöglicht. Angenommen, Sie suchen nach "Star Trek", das die IMDB-App vorschlägt. Je mehr Nutzer die IMDB-App öffnen oder installieren, desto mehr wird sie in den Suchergebnissen aller Nutzer angezeigt.
  • Es liefert genauere Ergebnisse für Lookup-Hinweise in Notes. Angenommen, Sie haben eine Notiz mit dem Wort "Apfel" darin. Sie führen eine Nachschlagesuche durch, und Sie erhalten Ergebnisse nicht nur für die Wörterbuchdefinition, sondern auch für die Apple-Website, Standorte von Apple-Stores und so weiter. Je mehr Leute auf bestimmte Ergebnisse tippen, desto höher und häufiger werden sie im Lookup für alle anderen angezeigt.

Verwenden wir Emojis als Beispiel. In iOS 10 führte Apple eine neue Emoji-Ersatzfunktion auf iMessage ein. Tippe das Wort "Liebe" ein und du kannst es durch ein Herz-Emoji ersetzen. Tippe das Wort "Hund" ein und - du hast es erraten - du kannst es durch einen Hundemoji ersetzen.

Auf ähnliche Weise kann Ihr iPhone vorhersagen, welche Emoji Sie möchten. Wenn Sie beispielsweise die Nachricht "Ich gehe mit dem Hund" eingeben, schlägt Ihr iPhone hilfreich den Emoji des Hundes vor.

So nimmt Apple all diese kleinen Teile von iMessage-Daten, die es sammelt, untersucht sie als Ganzes und kann Muster daraus ableiten, was die Leute tippen und in welchem ​​Kontext. Das bedeutet, dass dein iPhone schlauere Entscheidungen treffen kann, weil es von all den Textkonversationen profitiert, die andere kreieren und denkt, "dies ist wahrscheinlich das Emoji, das du willst."

Es nimmt ein Dorf( von Emoji)

Der Nachteil von Differential Privacy istEs liefert keine genauen Ergebnisse in kleinen Proben. Es liegt in der Macht, bestimmte Daten vage zu machen, so dass sie keinem einzelnen Benutzer zugeordnet werden können. Damit es funktioniert und gut funktioniert, müssen viele Benutzer teilnehmen.

Es ist so, als würde man ein Bitmap-Foto ganz nah betrachten. Sie werden nicht in der Lage zu sehen, was es ist, wenn Sie nur ein paar Bits betrachten, aber wenn Sie zurücktreten und das Ganze betrachten, wird das Bild klarer und definierter, auch wenn es nicht sehr hoch istAuflösung.

Um unter anderem den Emoji-Ersatz und die Vorhersage zu verbessern, muss Apple iPhone- und Mac-Daten aus der ganzen Welt sammeln, um ein immer klareres Bild davon zu erhalten, was die Leute tun und damit ihre Apps und Dienste verbessern. Es wendet sich an all diese randomisierten, lärmenden, crowdsourced Daten und miniert es für Muster - wie zum Beispiel, wie viele Benutzer den Pfirsich-Emoji anstelle von "Hintern" verwenden.

Die Macht von Differential Privacy hängt also davon ab, ob Apple in der Lage istgroße Mengen aggregierter Daten, wobei sichergestellt wird, dass niemand weiß, wer diese Daten sendet.

Deaktivieren der differenziellen Privatsphäre in iOS und macOS

Wenn Sie immer noch nicht überzeugt sind, dass Differential Privacy für Sie das Richtige ist, haben Sie Glück. Sie können sich direkt von den Einstellungen Ihres Geräts abmelden.

Tippen Sie auf Ihrem iOS-Gerät auf "Einstellungen" und dann auf "Datenschutz".

Tippen Sie auf dem Bildschirm Privatsphäre auf "Diagnose &Verwendung".

Schließlich auf der Diagnose &Auf dem Anwendungsbildschirm tippen Sie auf "Nicht senden".

Öffnen Sie auf macOS die Systemeinstellungen und klicken Sie auf "Sicherheit &Privatsphäre".

In der Sicherheit &Datenschutzeinstellungen, klicken Sie auf die Registerkarte "Datenschutz" und stellen Sie sicher, dass "Send diagnostic &Nutzungsdaten an Apple "ist deaktiviert. Beachten Sie, dass Sie auf das Schlosssymbol in der unteren linken Ecke klicken und Ihr Systempasswort eingeben müssen, bevor Sie diese Änderung vornehmen können.

Offensichtlich gibt es sowohl in der Theorie als auch in der Anwendung viel mehr als bei dieser vereinfachten Erklärung. Das Fleisch und die Kartoffeln von ihm verlassen sich stark auf einige ernsthafte Mathematik und als solche kann es ziemlich schwer und kompliziert werden.

Hoffentlich gibt Ihnen dies jedoch eine Vorstellung davon, wie es funktioniert und dass Sie sich sicherer darüber fühlen, dass Unternehmen bestimmte Daten sammeln, ohne befürchten zu müssen, identifiziert zu werden.