A Paradigm for Masking (Camouflaging) Information

This is an expository paper. Here we propose a decision-theoretic framework for addressing aspects of the confidentiality of information problems in publicly released data. Our basic premise is that the problem needs to be conceptualized by looking at the actions of three agents: a data collector, a...

Ausführliche Beschreibung

Bibliographische Detailangaben
Veröffentlicht in:International Statistical Review / Revue Internationale de Statistique. - Blackwell Publishing Ltd. - 73(2005), 3, Seite 331-349
1. Verfasser: Keller-McNulty, Sallie (VerfasserIn)
Weitere Verfasser: Nakhleh, Charles W., Singpurwalla, Nozer D.
Format: Online-Aufsatz
Sprache:English
Veröffentlicht: 2005
Zugriff auf das übergeordnete Werk:International Statistical Review / Revue Internationale de Statistique
Schlagworte:Decision-theory Entropy Intrusion Shannon information Statistical disclosure limitation Utility Physical sciences Information science Health sciences Mathematics mehr... Economics Behavioral sciences
LEADER 01000caa a22002652 4500
001 JST041661672
003 DE-627
005 20240621073705.0
007 cr uuu---uuuuu
008 150324s2005 xx |||||o 00| ||eng c
035 |a (DE-627)JST041661672 
035 |a (JST)25472679 
040 |a DE-627  |b ger  |c DE-627  |e rakwb 
041 |a eng 
100 1 |a Keller-McNulty, Sallie  |e verfasserin  |4 aut 
245 1 2 |a A Paradigm for Masking (Camouflaging) Information 
264 1 |c 2005 
336 |a Text  |b txt  |2 rdacontent 
337 |a Computermedien  |b c  |2 rdamedia 
338 |a Online-Ressource  |b cr  |2 rdacarrier 
520 |a This is an expository paper. Here we propose a decision-theoretic framework for addressing aspects of the confidentiality of information problems in publicly released data. Our basic premise is that the problem needs to be conceptualized by looking at the actions of three agents: a data collector, a legitimate data user, and an intruder. Here we aim to prescribe the actions of the first agent who desires to provide useful information to the second agent, but must protect against possible misuse by the third. The first agent is under the constraint that the released data has to be public to all; this in some societies may not be the case. A novel aspect of our paper is that all utilities-fundamental to decision making-are in terms of Shannon's information entropy. Thus what gets released is a distribution whose entropy maximizes the expected utility of the first agent. This means that the distribution that gets released will be different from that which generates the collected data. The discrepancy between the two distributions can be assessed via the Kullback-Leibler cross-entropy function. Our proposed strategy therefore boils down to the notion that it is the information content of the data, not the actual data, that gets masked. Current practice of "statistical disclosure limitation" masks the observed data via transformations or cell suppression. These transformations are guided by balancing what are known as "disclosure risks" and "data utility". The entropy indexed utility functions we propose are isomorphic to the above two entities. Thus our approach provides a formal link to that which is currently practiced in statistical disclosure limitation. /// Ceci est un article exploratoire. Nous proposons ici un cadre théorique de décision pour traiter d'aspects des problèmes de confidentialité de l'information dans les données diffusées au public. Notre hypothèse de base est que le problème doit être conceptualisé en observant les actions de trois agents: un collecteur de données, un utilisateur légitime d'informations et un intrus. Nous cherchons ici à prescrire les actions du premier agent qui désire fournir des informations utiles au second mais doit se protéger contre une possible mauvaise utilisation par le troisième. La contrainte pour le premier agent est que les données diffusées doivent être entièrement publiques; ce n'est pas forcément le cas dans certaines sociétés. Un aspect original de l'article est que toutes les utilités-fondamentales pour la prise de décision-sont en terme d'entropie d'informations de Shannon. Aussi ce qui va être diffusé est une distribution dont l'entropie maximise l'utilité attendue du premier agent. Cela signifie que la distribution qui va être diffusée sera différente de ce que génèrent les données collectées. Les divergences entre les deux distributions peuvent être mesurées avec la fonction d'entropie de Kullback-Leibler. Par conséquent la stratégie que nous proposons revient à considérer que c'est le contenu en informations des données, et non les données elles-mêmes, qui reste masqué. La pratique actuelle de "limitation de divulgation statistique" masque les données observées via des transformations ou suppressions de cellules. Ces transformations résultent d'un équilibre entre ce qui est connu comme "risques de divulgation" et "utilité des données". Les fonctions d'utilité indexée d'entropie que nous proposons sont isomorphes des deux entités mentionnées ci-dessus. Aussi notre approche fournit un lien formel avec la pratique courante dans la limitation de divulgation statistique. 
540 |a Copyright 2005 International Statistical Institute 
650 4 |a Decision-theory 
650 4 |a Entropy 
650 4 |a Intrusion 
650 4 |a Shannon information 
650 4 |a Statistical disclosure limitation 
650 4 |a Utility 
650 4 |a Physical sciences  |x Physics  |x Thermodynamics  |x Thermodynamic properties  |x Entropy 
650 4 |a Information science  |x Information management  |x Data management  |x Data architecture  |x Data security  |x Data masking 
650 4 |a Health sciences  |x Health and wellness  |x Public health  |x Health policy  |x Health care information privacy  |x Patient confidentiality 
650 4 |a Information science  |x Coding theory 
650 4 |a Mathematics  |x Pure mathematics  |x Probability theory  |x Random variables 
650 4 |a Economics  |x Microeconomics  |x Economic utility  |x Utility functions 
650 4 |a Behavioral sciences  |x Psychology  |x Cognitive psychology  |x Cognitive processes  |x Thought processes  |x Conceptualization 
650 4 |a Economics  |x Microeconomics  |x Economic utility  |x Expected utility 
650 4 |a Mathematics  |x Applied mathematics  |x Statistics 
650 4 |a Information science  |x Data products  |x Databases 
655 4 |a research-article 
700 1 |a Nakhleh, Charles W.  |e verfasserin  |4 aut 
700 1 |a Singpurwalla, Nozer D.  |e verfasserin  |4 aut 
773 0 8 |i Enthalten in  |t International Statistical Review / Revue Internationale de Statistique  |d Blackwell Publishing Ltd  |g 73(2005), 3, Seite 331-349  |w (DE-627)327815280  |w (DE-600)2045049-7  |x 17515823  |7 nnns 
773 1 8 |g volume:73  |g year:2005  |g number:3  |g pages:331-349 
856 4 0 |u https://www.jstor.org/stable/25472679  |3 Volltext 
912 |a GBV_USEFLAG_A 
912 |a SYSFLAG_A 
912 |a GBV_JST 
912 |a GBV_ILN_11 
912 |a GBV_ILN_20 
912 |a GBV_ILN_22 
912 |a GBV_ILN_23 
912 |a GBV_ILN_24 
912 |a GBV_ILN_26 
912 |a GBV_ILN_31 
912 |a GBV_ILN_32 
912 |a GBV_ILN_39 
912 |a GBV_ILN_40 
912 |a GBV_ILN_60 
912 |a GBV_ILN_62 
912 |a GBV_ILN_63 
912 |a GBV_ILN_65 
912 |a GBV_ILN_69 
912 |a GBV_ILN_70 
912 |a GBV_ILN_73 
912 |a GBV_ILN_74 
912 |a GBV_ILN_90 
912 |a GBV_ILN_95 
912 |a GBV_ILN_100 
912 |a GBV_ILN_101 
912 |a GBV_ILN_105 
912 |a GBV_ILN_110 
912 |a GBV_ILN_120 
912 |a GBV_ILN_138 
912 |a GBV_ILN_150 
912 |a GBV_ILN_151 
912 |a GBV_ILN_161 
912 |a GBV_ILN_170 
912 |a GBV_ILN_171 
912 |a GBV_ILN_187 
912 |a GBV_ILN_213 
912 |a GBV_ILN_224 
912 |a GBV_ILN_230 
912 |a GBV_ILN_266 
912 |a GBV_ILN_285 
912 |a GBV_ILN_293 
912 |a GBV_ILN_370 
912 |a GBV_ILN_374 
912 |a GBV_ILN_602 
912 |a GBV_ILN_636 
912 |a GBV_ILN_647 
912 |a GBV_ILN_702 
912 |a GBV_ILN_2001 
912 |a GBV_ILN_2003 
912 |a GBV_ILN_2004 
912 |a GBV_ILN_2005 
912 |a GBV_ILN_2006 
912 |a GBV_ILN_2007 
912 |a GBV_ILN_2008 
912 |a GBV_ILN_2009 
912 |a GBV_ILN_2010 
912 |a GBV_ILN_2011 
912 |a GBV_ILN_2014 
912 |a GBV_ILN_2015 
912 |a GBV_ILN_2018 
912 |a GBV_ILN_2020 
912 |a GBV_ILN_2021 
912 |a GBV_ILN_2025 
912 |a GBV_ILN_2026 
912 |a GBV_ILN_2027 
912 |a GBV_ILN_2031 
912 |a GBV_ILN_2034 
912 |a GBV_ILN_2037 
912 |a GBV_ILN_2038 
912 |a GBV_ILN_2039 
912 |a GBV_ILN_2044 
912 |a GBV_ILN_2048 
912 |a GBV_ILN_2049 
912 |a GBV_ILN_2050 
912 |a GBV_ILN_2055 
912 |a GBV_ILN_2056 
912 |a GBV_ILN_2057 
912 |a GBV_ILN_2059 
912 |a GBV_ILN_2061 
912 |a GBV_ILN_2064 
912 |a GBV_ILN_2068 
912 |a GBV_ILN_2088 
912 |a GBV_ILN_2093 
912 |a GBV_ILN_2106 
912 |a GBV_ILN_2107 
912 |a GBV_ILN_2108 
912 |a GBV_ILN_2110 
912 |a GBV_ILN_2111 
912 |a GBV_ILN_2112 
912 |a GBV_ILN_2113 
912 |a GBV_ILN_2118 
912 |a GBV_ILN_2119 
912 |a GBV_ILN_2122 
912 |a GBV_ILN_2129 
912 |a GBV_ILN_2143 
912 |a GBV_ILN_2144 
912 |a GBV_ILN_2147 
912 |a GBV_ILN_2148 
912 |a GBV_ILN_2152 
912 |a GBV_ILN_2153 
912 |a GBV_ILN_2188 
912 |a GBV_ILN_2190 
912 |a GBV_ILN_2232 
912 |a GBV_ILN_2336 
912 |a GBV_ILN_2470 
912 |a GBV_ILN_2472 
912 |a GBV_ILN_2507 
912 |a GBV_ILN_2522 
912 |a GBV_ILN_2548 
912 |a GBV_ILN_2938 
912 |a GBV_ILN_2947 
912 |a GBV_ILN_2949 
912 |a GBV_ILN_2950 
912 |a GBV_ILN_4012 
912 |a GBV_ILN_4035 
912 |a GBV_ILN_4037 
912 |a GBV_ILN_4046 
912 |a GBV_ILN_4112 
912 |a GBV_ILN_4125 
912 |a GBV_ILN_4126 
912 |a GBV_ILN_4242 
912 |a GBV_ILN_4246 
912 |a GBV_ILN_4249 
912 |a GBV_ILN_4251 
912 |a GBV_ILN_4305 
912 |a GBV_ILN_4306 
912 |a GBV_ILN_4307 
912 |a GBV_ILN_4313 
912 |a GBV_ILN_4322 
912 |a GBV_ILN_4323 
912 |a GBV_ILN_4324 
912 |a GBV_ILN_4325 
912 |a GBV_ILN_4326 
912 |a GBV_ILN_4333 
912 |a GBV_ILN_4334 
912 |a GBV_ILN_4335 
912 |a GBV_ILN_4336 
912 |a GBV_ILN_4338 
912 |a GBV_ILN_4346 
912 |a GBV_ILN_4392 
912 |a GBV_ILN_4393 
912 |a GBV_ILN_4700 
951 |a AR 
952 |d 73  |j 2005  |e 3  |h 331-349