Steganalysis via a convolutional neural network using large convolution filters for embedding process with same stego key: A deep learning approach for telemedicine
M. Salomon, R. Couturier, C. Guyeux, J.-F. Couchot, J.M. Bahi
{"title":"Steganalysis via a convolutional neural network using large convolution filters for embedding process with same stego key: A deep learning approach for telemedicine","authors":"M. Salomon, R. Couturier, C. Guyeux, J.-F. Couchot, J.M. Bahi","doi":"10.1016/j.eurtel.2017.06.001","DOIUrl":null,"url":null,"abstract":"<div><h3>Introduction</h3><p>Steganography, the art to hide information inside host media like pictures and movies, and steganalysis, its countermeasure attempting to detect the presence of an hidden information within an innocent-looking document, are frequently reported as promising information security techniques for telemedicine. For the past few years, in the race between image steganography and steganalysis, deep learning has emerged as a very promising alternative to steganalyzer approaches based on rich image models combined with ensemble classifiers. A key knowledge of image steganalyzer, which combines relevant image features and innovative classification procedures, can be deduced by a deep learning approach called convolutional neural networks (CNN). This kind of deep learning networks is so well-suited for classification tasks based on the detection of variations in 2D shapes that it is the state-of-the-art in many image recognition problems.</p></div><div><h3>Materials and methods</h3><p>We design a CNN-based steganalyzer for images obtained by applying steganography with a unique embedding key. The proposed CNN has a quite different shape compared to the ones resulting from the earlier works, and it is able to provide high detection accuracy for several steganographics tools when the same stego key is reused during the embedding process. The convolutional part of our proposal starts by a global filtering, using a single filter, followed by a second convolutional layer that produces a reduced set of high-level features (256 features for 512<!--> <!-->×<!--> <!-->512 pixels input images) thanks to the use of large filters.</p></div><div><h3>Results</h3><p>The proposed architecture embeds less convolutions, with much larger filters in the final convolutional layer, and is more general: it is able to deal with larger images and lower payloads. For the “same embedding key” scenario, our proposal outperforms all other steganalyzers, in particular the existing CNN-based ones, and defeats many state-of-the-art image steganography schemes. The information encoded by the final vector of features is so discriminating that the classifier part can be reduced to only two output neurons. We finally evaluated the detection ability of the CNN against two spatial domain steganographic schemes and a frequency domain one. More precisely, we designed a perfect steganalyzer for embedding payloads of 0.4 bit per pixel, and for all the steganographic tools investigated in this article (working either in spatial or in frequency domains). Rather interesting results have been obtained too, albeit to a lesser extent, for a payload value of 0.1 bpp.</p></div><div><h3>Discussion and conclusions</h3><p>The obtained results are very encouraging, and they outperform all the previous deep learning proposals for steganalysis. A first step in the design of a universal detector has been achieved too, as we are able to detect HUGO based hidden messages even when a WOW steganographier has been used during the training stage. These results allow us to propose to add fragile watermarks on media like pictures or pdf medical documents, to guarantee the authenticity of the material: any attempt of modification of the support will alter the watermark, proving by doing so the modification. Another application is to add personal and medical information inside medical images.</p></div><div><h3>Introduction</h3><p>La stéganographie, l’art de dissimuler de l’information au sein de médias numériques tels que les images et les vidéos, et la stéganalyse, sa contre-mesure tentant de détecter la présence d’une information secrète dans un document semblant innocent, sont fréquemment signalés comme étant des techniques de sécurité intéressantes pour la télémédecine. Au cours des dernières années, l’apprentissage profond (<em>deep learning</em><span>) a émergé dans la compétition entre stéganographie et stéganalyse, paraissant une alternative intéressante dans le cadre des stéganalyseurs basés sur des modèles raffinés d’image couplés avec des classifieurs d’ensembles. On peut alors combiner une sélection bien choisie de caractéristiques d’images avec des procédures innovantes de classification, au travers d’une approche d’apprentissage approfondie moderne appelée les réseaux de neurones convolutionnels (RNC). Ces réseaux, qui sont faits pour de la classification basée sur de la détection de variations dans les formes 2D, produisent la plupart du temps les meilleurs résultats dans divers problèmes de reconnaissance d’images.</span></p></div><div><h3>Matériel et méthodes</h3><p>Nous avons programmé un stéganalyseur basé sur les RNC, pour des images stéganographiées avec une seule et même clé secrète. Le RNC proposé a une structure assez différente des réseaux développés jusqu’ici, et il est capable de fournir un fort taux de détection sur de nombreux logiciels de stéganographie, sous l’hypothèse que l’adversaire n’utilise qu’une seule clé d’embarquement. La partie « convolutionnelle » de notre approche commence par un filtrage global n’utilisant qu’un seul filtre, suivi par une seconde couche convolutionnelle, qui produit un ensemble réduit de caractéristiques de haute qualité (256 caractéristiques pour 512<!--> <!-->×<!--> <!-->512 pixels) grâce à l’utilisation de larges filtres.</p></div><div><h3>Résultats</h3><p>L’architecture proposée embarque un plus faible nombre de convolutions que ce qui se trouve habituellement dans la littérature. Les filtres sont plus larges dans la dernière couche de convolution, et le réseau dans son ensemble est plus général : il permet de considérer des images plus larges, et de plus faibles taux d’embarquement. Pour le scénario d’une seule clé, nos résultats sont meilleurs que tous les autres stéganaliseurs, dont ceux basés sur des RNC, et nous pouvons mettre en échec de nombreux outils de stéganographie. L’information encodée par le vecteur final de caractéristiques est si discriminant, que la partie de classification peut se réduire à deux neurones de sortie. Nous avons finalement évalué la capacité de détection de notre RNC contre deux algorithmes de stéganographie fonctionnant dans le domaine spatial, et un dans le domaine fréquentiel. Nous avons obtenu un stéganalyseur parfait pour un taux d’embarquement de 0,4 bit par pixel, et ce pour tous les algorithmes considérés dans cet article. Des résultats intéressants, quoique moins surprenants, ont aussi été obtenus avec un taux d’embarquement de 0,1 bpp.</p></div><div><h3>Discussion et conclusion</h3><p>Les résultats obtenus sont très encourageants, et ils améliorent les résultats obtenus jusqu’à présent dans l’apprentissage approfondis pour la stéganalyse. Ces résultats nous permettent d’envisager l’utilisation de la stéganographie pour la télémédecine, comme l’ajout d’une marque fragile dans des documents médicaux, pour en garantir leur authenticité, ou l’insertion des informations de patients dans des images médicales.</p></div>","PeriodicalId":100509,"journal":{"name":"European Research in Telemedicine / La Recherche Européenne en Télémédecine","volume":"6 2","pages":"Pages 79-92"},"PeriodicalIF":0.0000,"publicationDate":"2017-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://sci-hub-pdf.com/10.1016/j.eurtel.2017.06.001","citationCount":"52","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"European Research in Telemedicine / La Recherche Européenne en Télémédecine","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S2212764X17300614","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 52
Abstract
Introduction
Steganography, the art to hide information inside host media like pictures and movies, and steganalysis, its countermeasure attempting to detect the presence of an hidden information within an innocent-looking document, are frequently reported as promising information security techniques for telemedicine. For the past few years, in the race between image steganography and steganalysis, deep learning has emerged as a very promising alternative to steganalyzer approaches based on rich image models combined with ensemble classifiers. A key knowledge of image steganalyzer, which combines relevant image features and innovative classification procedures, can be deduced by a deep learning approach called convolutional neural networks (CNN). This kind of deep learning networks is so well-suited for classification tasks based on the detection of variations in 2D shapes that it is the state-of-the-art in many image recognition problems.
Materials and methods
We design a CNN-based steganalyzer for images obtained by applying steganography with a unique embedding key. The proposed CNN has a quite different shape compared to the ones resulting from the earlier works, and it is able to provide high detection accuracy for several steganographics tools when the same stego key is reused during the embedding process. The convolutional part of our proposal starts by a global filtering, using a single filter, followed by a second convolutional layer that produces a reduced set of high-level features (256 features for 512 × 512 pixels input images) thanks to the use of large filters.
Results
The proposed architecture embeds less convolutions, with much larger filters in the final convolutional layer, and is more general: it is able to deal with larger images and lower payloads. For the “same embedding key” scenario, our proposal outperforms all other steganalyzers, in particular the existing CNN-based ones, and defeats many state-of-the-art image steganography schemes. The information encoded by the final vector of features is so discriminating that the classifier part can be reduced to only two output neurons. We finally evaluated the detection ability of the CNN against two spatial domain steganographic schemes and a frequency domain one. More precisely, we designed a perfect steganalyzer for embedding payloads of 0.4 bit per pixel, and for all the steganographic tools investigated in this article (working either in spatial or in frequency domains). Rather interesting results have been obtained too, albeit to a lesser extent, for a payload value of 0.1 bpp.
Discussion and conclusions
The obtained results are very encouraging, and they outperform all the previous deep learning proposals for steganalysis. A first step in the design of a universal detector has been achieved too, as we are able to detect HUGO based hidden messages even when a WOW steganographier has been used during the training stage. These results allow us to propose to add fragile watermarks on media like pictures or pdf medical documents, to guarantee the authenticity of the material: any attempt of modification of the support will alter the watermark, proving by doing so the modification. Another application is to add personal and medical information inside medical images.
Introduction
La stéganographie, l’art de dissimuler de l’information au sein de médias numériques tels que les images et les vidéos, et la stéganalyse, sa contre-mesure tentant de détecter la présence d’une information secrète dans un document semblant innocent, sont fréquemment signalés comme étant des techniques de sécurité intéressantes pour la télémédecine. Au cours des dernières années, l’apprentissage profond (deep learning) a émergé dans la compétition entre stéganographie et stéganalyse, paraissant une alternative intéressante dans le cadre des stéganalyseurs basés sur des modèles raffinés d’image couplés avec des classifieurs d’ensembles. On peut alors combiner une sélection bien choisie de caractéristiques d’images avec des procédures innovantes de classification, au travers d’une approche d’apprentissage approfondie moderne appelée les réseaux de neurones convolutionnels (RNC). Ces réseaux, qui sont faits pour de la classification basée sur de la détection de variations dans les formes 2D, produisent la plupart du temps les meilleurs résultats dans divers problèmes de reconnaissance d’images.
Matériel et méthodes
Nous avons programmé un stéganalyseur basé sur les RNC, pour des images stéganographiées avec une seule et même clé secrète. Le RNC proposé a une structure assez différente des réseaux développés jusqu’ici, et il est capable de fournir un fort taux de détection sur de nombreux logiciels de stéganographie, sous l’hypothèse que l’adversaire n’utilise qu’une seule clé d’embarquement. La partie « convolutionnelle » de notre approche commence par un filtrage global n’utilisant qu’un seul filtre, suivi par une seconde couche convolutionnelle, qui produit un ensemble réduit de caractéristiques de haute qualité (256 caractéristiques pour 512 × 512 pixels) grâce à l’utilisation de larges filtres.
Résultats
L’architecture proposée embarque un plus faible nombre de convolutions que ce qui se trouve habituellement dans la littérature. Les filtres sont plus larges dans la dernière couche de convolution, et le réseau dans son ensemble est plus général : il permet de considérer des images plus larges, et de plus faibles taux d’embarquement. Pour le scénario d’une seule clé, nos résultats sont meilleurs que tous les autres stéganaliseurs, dont ceux basés sur des RNC, et nous pouvons mettre en échec de nombreux outils de stéganographie. L’information encodée par le vecteur final de caractéristiques est si discriminant, que la partie de classification peut se réduire à deux neurones de sortie. Nous avons finalement évalué la capacité de détection de notre RNC contre deux algorithmes de stéganographie fonctionnant dans le domaine spatial, et un dans le domaine fréquentiel. Nous avons obtenu un stéganalyseur parfait pour un taux d’embarquement de 0,4 bit par pixel, et ce pour tous les algorithmes considérés dans cet article. Des résultats intéressants, quoique moins surprenants, ont aussi été obtenus avec un taux d’embarquement de 0,1 bpp.
Discussion et conclusion
Les résultats obtenus sont très encourageants, et ils améliorent les résultats obtenus jusqu’à présent dans l’apprentissage approfondis pour la stéganalyse. Ces résultats nous permettent d’envisager l’utilisation de la stéganographie pour la télémédecine, comme l’ajout d’une marque fragile dans des documents médicaux, pour en garantir leur authenticité, ou l’insertion des informations de patients dans des images médicales.