2Sep

Vad är "differentiell integritet" och hur håller det mina data anonym?

Apple stakar sitt rykte på att se till att de data som samlar in från dig är privata. Hur? Genom att använda något som heter "Differential Privacy."

Vad är differentiell integritet?

Apple förklarar det som sådant:

Apple använder Differential Privacy-teknik för att upptäcka användningsmönster för ett stort antal användare utan att äventyra enskild integritet. För att dölja en persons identitet lägger Differential Privacy till matematiskt brus till ett litet urval av individens användningsmönster. När fler människor delar samma mönster börjar generella mönster komma fram, vilket kan informera och förbättra användarupplevelsen.

Filosofin bakom differentiell sekretess är följande: En användare vars apparat, oavsett om det är en iPhone, iPad eller Mac, lägger till en beräkning till en större pool av aggregerade data( en stor bild som bildas av olika mindre bilder), bör inte avslöjassom källa, än mindre vilka data de bidrog med.

Apple är inte det enda företaget som gör det, antingen - både Google och Microsoft använde det ännu tidigare. Men Apple publicerade det genom att prata om det i detalj vid sin 2016 WWDC-nyckel.

Så hur skiljer det sig från andra anonymiserade data, frågar du? Tja, anonymiserade data kan fortfarande användas för att avleda personlig information om du vet tillräckligt om en person.

Låt oss säga att en hacker kan få tillgång till en anonymiserad databas som avslöjar ett företags löneavgift. Låt oss säga att de också vet att Medarbetare X flyttar till ett annat område. Hackaren kunde då enkelt fråga databasen före och efter att Medarbetare X flyttar och enkelt dras av sin inkomst.

För att skydda Employee Xs känsliga uppgifter, ändrar Differential Privacy dataen med matematiskt "brus" och andra tekniker så att om du frågar databasen får du bara en approximation av hur mycket( eller någon annan) Medarbetare X varbetald.

Därför bevaras hans integritet på grund av skillnaden mellan de data som tillhandahålls och det ljud som läggs till det, så det är då vagt nog att det är praktiskt taget omöjligt att veta om den data du tittar på faktiskt är en viss individs.

Hur fungerar Apples olika personuppgifter?

Differentiell integritet är ett relativt nytt koncept, men tanken är att det kan ge ett företag skarpt insikter baserat på data från sina användare utan att veta vad exakt säger eller som den här kommer från.

Apple förlitar sig till exempel på tre komponenter för att få det att fungera för olika sekretessskydd på din Mac eller iOS-enhet: hash, subsampling och ljudinsprutning.

Hashing tar en sträng text och gör den till ett kortare värde med en fast längd och blandar dessa nycklar upp i irreversibelt slumpmässiga strängar med unika tecken eller "hash".Detta döljer dina data så att enheten inte lagrar någon av den i sin ursprungliga form.

Subsampling betyder att i stället för att samla varje ord en persons typer, kommer Apple bara att använda ett mindre urval av dem. Låt oss till exempel säga att du har en lång textkonversation med en vän som liberellt använder emoji. Istället för att samla hela samtalet kan subsampling istället bara använda de delar som Apple är intresserad av, som emoji.

Din enhet injicerar slutligen brus, lägger till slumpmässiga data i originaldatasetet för att göra det mer vagt. Det betyder att Apple får ett resultat som blivit maskerat någonsin så lite och därför inte helt exakt.

Allt detta händer på din enhet, så det har redan förkortats, blandats upp, samplats och suddat innan det ens skickas till molnet för att Apple ska analysera.

Var används Apples olika sekretess?

Det finns många olika fall där Apple kanske vill samla in data för att förbättra sina appar och tjänster. Just nu använder Apple dock bara Differential Privacy på fyra specifika områden.

  • När tillräckligt många ersätter ett ord med en viss emoji blir det ett förslag för alla.
  • När nya ord läggs till i tillräckligt många lokala ordböcker för att betraktas som vanligt kommer Apple att lägga till det i andras ordlista också.
  • Du kan använda en sökterm i Spotlight, och det kommer då att ge appförslag och öppna den länken i appen eller låta dig installera den från App Store. Till exempel, säg att du söker efter "Star Trek", vilket föreslår IMDB-appen. Ju fler människor öppnar eller installerar IMDB-appen, desto mer kommer det att visas i alles sökresultat.
  • Det kommer att ge mer exakta resultat för Lookup Hints i Notes. Till exempel, säg att du har en anteckning med ordet "äpple" i den. Du gör en sökningssökning och ger dig resultat inte bara för ordbordsdefinitionen utan även Apples webbplats, Apple Stores, etc. Förmodligen ju fler människor knappar på vissa resultat, desto högre och oftare kommer de att visas i Lookup för alla andra.

Låt oss använda emojis som ett exempel. IOS introducerade en ny emoji-ersättningsfunktion på iMessage. Skriv ordet "kärlek" och du kan ersätta det med en hjärtemoji.skriv ordet "hund" och-du gissade det-du kan ersätta den med en hund-emoji.

Likaså är det möjligt för din iPhone att förutsäga vilken emoji du vill ha om det, om du skriver ett meddelande "Jag ska gå hunden" kommer din iPhone till hjälp att rekommendera hundens emoji.

Så, Apple tar alla de små bitarna av iMessage-data som samlar in, undersöker dem som helhet och kan härleda mönster från vad folk skriver och i vilket sammanhang. Det betyder att din iPhone kan ge dig smartare val eftersom det drar nytta av alla de textkonversationer som andra skapar och tänker, "det här är förmodligen den emoji du vill ha."

Det tar en by( av emoji)

Nackdelen med olika sekretess är attDet ger inte exakta resultat i småprover. Det är kraften i att göra specifika data vaga så att den inte kan tillskrivas någon användare. För att det ska fungera och fungera bra måste många användare delta.

Det är typiskt att titta på ett bitmappat foto upp extremt nära. Du kommer inte att kunna se vad det är om du tittar på bara några bitar, men när du går tillbaka och tittar på det hela blir bilden klarare och mer definierad, även om den inte är superhögupplösning.

För att förbättra emoji-ersättning och förutsägelse( bland annat) behöver Apple därför samla iPhone- och Mac-data från hela världen för att ge den en allt tydligare bild av vad människor gör och därigenom förbättra sina appar och tjänster. Det vänder sig till alla dessa randomiserade, bullriga, crowdsourced data och gruvor det för mönster - som hur många användare använder persikosemoji i stället för "rumpa."

Således är kraften i Differential Privacy beroende av att Apple kan undersökastora mängder aggregerad data, samtidigt som det säkerställs att det inte är klokare om vem som skickar dem den data.

Hur man väljer bort olik sekretess i iOS och macOS

Om du fortfarande inte är övertygad om att Differential Privacy är rätt för dig, har du lycka till. Du kan välja bort direkt från enhetens inställningar.

På din iOS-enhet, tryck på Öppna "Inställningar" och sedan "Sekretess".

På skärmen Sekretess trycker du på "Diagnostik &Användande".

Slutligen, på Diagnostics &Användningsskärm, tryck på "Skicka inte".

Öppna MacOS, öppna Systeminställningar och klicka på "Säkerhet &Integritet".

I Säkerhet &Sekretesspreferenser, klicka på fliken "Sekretess" och kontrollera sedan "Skicka diagnostik &användningsdata till Apple "är avmarkerad. Observera att du måste klicka på låsikonen i det nedre vänstra hörnet och ange ditt systemlösenord innan du kan göra den här ändringen.

Självklart finns det mycket mer till Differential Privacy, både i teori och tillämpning, än denna förenklade förklaring. Köttet och potatisen av det är starkt beroende av någon allvarlig matematik och kan därför bli ganska tung och komplicerad.

Förhoppningsvis ger detta dig en uppfattning om hur det fungerar och att du känner dig mer säker på att företag samlar in viss information utan rädsla för att identifieras.