Steganalysis via a convolutional neural network using large convolution filters for embedding process with same stego key: A deep learning approach for telemedicine

European Research in Telemedicine / La Recherche Européenne en Télémédecine Pub Date : 2017-07-01 DOI:10.1016/j.eurtel.2017.06.001

M. Salomon, R. Couturier, C. Guyeux, J.-F. Couchot, J.M. Bahi

{"title":"Steganalysis via a convolutional neural network using large convolution filters for embedding process with same stego key: A deep learning approach for telemedicine","authors":"M. Salomon, R. Couturier, C. Guyeux, J.-F. Couchot, J.M. Bahi","doi":"10.1016/j.eurtel.2017.06.001","DOIUrl":null,"url":null,"abstract":"<div><h3>Introduction</h3><p>Steganography, the art to hide information inside host media like pictures and movies, and steganalysis, its countermeasure attempting to detect the presence of an hidden information within an innocent-looking document, are frequently reported as promising information security techniques for telemedicine. For the past few years, in the race between image steganography and steganalysis, deep learning has emerged as a very promising alternative to steganalyzer approaches based on rich image models combined with ensemble classifiers. A key knowledge of image steganalyzer, which combines relevant image features and innovative classification procedures, can be deduced by a deep learning approach called convolutional neural networks (CNN). This kind of deep learning networks is so well-suited for classification tasks based on the detection of variations in 2D shapes that it is the state-of-the-art in many image recognition problems.</p></div><div><h3>Materials and methods</h3><p>We design a CNN-based steganalyzer for images obtained by applying steganography with a unique embedding key. The proposed CNN has a quite different shape compared to the ones resulting from the earlier works, and it is able to provide high detection accuracy for several steganographics tools when the same stego key is reused during the embedding process. The convolutional part of our proposal starts by a global filtering, using a single filter, followed by a second convolutional layer that produces a reduced set of high-level features (256 features for 512×512 pixels input images) thanks to the use of large filters.</p></div><div><h3>Results</h3><p>The proposed architecture embeds less convolutions, with much larger filters in the final convolutional layer, and is more general: it is able to deal with larger images and lower payloads. For the “same embedding key” scenario, our proposal outperforms all other steganalyzers, in particular the existing CNN-based ones, and defeats many state-of-the-art image steganography schemes. The information encoded by the final vector of features is so discriminating that the classifier part can be reduced to only two output neurons. We finally evaluated the detection ability of the CNN against two spatial domain steganographic schemes and a frequency domain one. More precisely, we designed a perfect steganalyzer for embedding payloads of 0.4 bit per pixel, and for all the steganographic tools investigated in this article (working either in spatial or in frequency domains). Rather interesting results have been obtained too, albeit to a lesser extent, for a payload value of 0.1 bpp.</p></div><div><h3>Discussion and conclusions</h3><p>The obtained results are very encouraging, and they outperform all the previous deep learning proposals for steganalysis. A first step in the design of a universal detector has been achieved too, as we are able to detect HUGO based hidden messages even when a WOW steganographier has been used during the training stage. These results allow us to propose to add fragile watermarks on media like pictures or pdf medical documents, to guarantee the authenticity of the material: any attempt of modification of the support will alter the watermark, proving by doing so the modification. Another application is to add personal and medical information inside medical images.</p></div><div><h3>Introduction</h3><p>La stéganographie, l’art de dissimuler de l’information au sein de médias numériques tels que les images et les vidéos, et la stéganalyse, sa contre-mesure tentant de détecter la présence d’une information secrète dans un document semblant innocent, sont fréquemment signalés comme étant des techniques de sécurité intéressantes pour la télémédecine. Au cours des dernières années, l’apprentissage profond (<em>deep learning</em><span>) a émergé dans la compétition entre stéganographie et stéganalyse, paraissant une alternative intéressante dans le cadre des stéganalyseurs basés sur des modèles raffinés d’image couplés avec des classifieurs d’ensembles. On peut alors combiner une sélection bien choisie de caractéristiques d’images avec des procédures innovantes de classification, au travers d’une approche d’apprentissage approfondie moderne appelée les réseaux de neurones convolutionnels (RNC). Ces réseaux, qui sont faits pour de la classification basée sur de la détection de variations dans les formes 2D, produisent la plupart du temps les meilleurs résultats dans divers problèmes de reconnaissance d’images.</span></p></div><div><h3>Matériel et méthodes</h3><p>Nous avons programmé un stéganalyseur basé sur les RNC, pour des images stéganographiées avec une seule et même clé secrète. Le RNC proposé a une structure assez différente des réseaux développés jusqu’ici, et il est capable de fournir un fort taux de détection sur de nombreux logiciels de stéganographie, sous l’hypothèse que l’adversaire n’utilise qu’une seule clé d’embarquement. La partie « convolutionnelle » de notre approche commence par un filtrage global n’utilisant qu’un seul filtre, suivi par une seconde couche convolutionnelle, qui produit un ensemble réduit de caractéristiques de haute qualité (256 caractéristiques pour 512×512 pixels) grâce à l’utilisation de larges filtres.</p></div><div><h3>Résultats</h3><p>L’architecture proposée embarque un plus faible nombre de convolutions que ce qui se trouve habituellement dans la littérature. Les filtres sont plus larges dans la dernière couche de convolution, et le réseau dans son ensemble est plus général : il permet de considérer des images plus larges, et de plus faibles taux d’embarquement. Pour le scénario d’une seule clé, nos résultats sont meilleurs que tous les autres stéganaliseurs, dont ceux basés sur des RNC, et nous pouvons mettre en échec de nombreux outils de stéganographie. L’information encodée par le vecteur final de caractéristiques est si discriminant, que la partie de classification peut se réduire à deux neurones de sortie. Nous avons finalement évalué la capacité de détection de notre RNC contre deux algorithmes de stéganographie fonctionnant dans le domaine spatial, et un dans le domaine fréquentiel. Nous avons obtenu un stéganalyseur parfait pour un taux d’embarquement de 0,4 bit par pixel, et ce pour tous les algorithmes considérés dans cet article. Des résultats intéressants, quoique moins surprenants, ont aussi été obtenus avec un taux d’embarquement de 0,1 bpp.</p></div><div><h3>Discussion et conclusion</h3><p>Les résultats obtenus sont très encourageants, et ils améliorent les résultats obtenus jusqu’à présent dans l’apprentissage approfondis pour la stéganalyse. Ces résultats nous permettent d’envisager l’utilisation de la stéganographie pour la télémédecine, comme l’ajout d’une marque fragile dans des documents médicaux, pour en garantir leur authenticité, ou l’insertion des informations de patients dans des images médicales.</p></div>","PeriodicalId":100509,"journal":{"name":"European Research in Telemedicine / La Recherche Européenne en Télémédecine","volume":"6 2","pages":"Pages 79-92"},"PeriodicalIF":0.0000,"publicationDate":"2017-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"https://sci-hub-pdf.com/10.1016/j.eurtel.2017.06.001","citationCount":"52","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"European Research in Telemedicine / La Recherche Européenne en Télémédecine","FirstCategoryId":"1085","ListUrlMain":"https://www.sciencedirect.com/science/article/pii/S2212764X17300614","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 52

Abstract

Introduction

Steganography, the art to hide information inside host media like pictures and movies, and steganalysis, its countermeasure attempting to detect the presence of an hidden information within an innocent-looking document, are frequently reported as promising information security techniques for telemedicine. For the past few years, in the race between image steganography and steganalysis, deep learning has emerged as a very promising alternative to steganalyzer approaches based on rich image models combined with ensemble classifiers. A key knowledge of image steganalyzer, which combines relevant image features and innovative classification procedures, can be deduced by a deep learning approach called convolutional neural networks (CNN). This kind of deep learning networks is so well-suited for classification tasks based on the detection of variations in 2D shapes that it is the state-of-the-art in many image recognition problems.

Materials and methods

We design a CNN-based steganalyzer for images obtained by applying steganography with a unique embedding key. The proposed CNN has a quite different shape compared to the ones resulting from the earlier works, and it is able to provide high detection accuracy for several steganographics tools when the same stego key is reused during the embedding process. The convolutional part of our proposal starts by a global filtering, using a single filter, followed by a second convolutional layer that produces a reduced set of high-level features (256 features for 512 × 512 pixels input images) thanks to the use of large filters.

Results

The proposed architecture embeds less convolutions, with much larger filters in the final convolutional layer, and is more general: it is able to deal with larger images and lower payloads. For the “same embedding key” scenario, our proposal outperforms all other steganalyzers, in particular the existing CNN-based ones, and defeats many state-of-the-art image steganography schemes. The information encoded by the final vector of features is so discriminating that the classifier part can be reduced to only two output neurons. We finally evaluated the detection ability of the CNN against two spatial domain steganographic schemes and a frequency domain one. More precisely, we designed a perfect steganalyzer for embedding payloads of 0.4 bit per pixel, and for all the steganographic tools investigated in this article (working either in spatial or in frequency domains). Rather interesting results have been obtained too, albeit to a lesser extent, for a payload value of 0.1 bpp.

Discussion and conclusions

The obtained results are very encouraging, and they outperform all the previous deep learning proposals for steganalysis. A first step in the design of a universal detector has been achieved too, as we are able to detect HUGO based hidden messages even when a WOW steganographier has been used during the training stage. These results allow us to propose to add fragile watermarks on media like pictures or pdf medical documents, to guarantee the authenticity of the material: any attempt of modification of the support will alter the watermark, proving by doing so the modification. Another application is to add personal and medical information inside medical images.

Introduction

La stéganographie, l’art de dissimuler de l’information au sein de médias numériques tels que les images et les vidéos, et la stéganalyse, sa contre-mesure tentant de détecter la présence d’une information secrète dans un document semblant innocent, sont fréquemment signalés comme étant des techniques de sécurité intéressantes pour la télémédecine. Au cours des dernières années, l’apprentissage profond (deep learning) a émergé dans la compétition entre stéganographie et stéganalyse, paraissant une alternative intéressante dans le cadre des stéganalyseurs basés sur des modèles raffinés d’image couplés avec des classifieurs d’ensembles. On peut alors combiner une sélection bien choisie de caractéristiques d’images avec des procédures innovantes de classification, au travers d’une approche d’apprentissage approfondie moderne appelée les réseaux de neurones convolutionnels (RNC). Ces réseaux, qui sont faits pour de la classification basée sur de la détection de variations dans les formes 2D, produisent la plupart du temps les meilleurs résultats dans divers problèmes de reconnaissance d’images.

Matériel et méthodes

Nous avons programmé un stéganalyseur basé sur les RNC, pour des images stéganographiées avec une seule et même clé secrète. Le RNC proposé a une structure assez différente des réseaux développés jusqu’ici, et il est capable de fournir un fort taux de détection sur de nombreux logiciels de stéganographie, sous l’hypothèse que l’adversaire n’utilise qu’une seule clé d’embarquement. La partie « convolutionnelle » de notre approche commence par un filtrage global n’utilisant qu’un seul filtre, suivi par une seconde couche convolutionnelle, qui produit un ensemble réduit de caractéristiques de haute qualité (256 caractéristiques pour 512 × 512 pixels) grâce à l’utilisation de larges filtres.

Résultats

L’architecture proposée embarque un plus faible nombre de convolutions que ce qui se trouve habituellement dans la littérature. Les filtres sont plus larges dans la dernière couche de convolution, et le réseau dans son ensemble est plus général : il permet de considérer des images plus larges, et de plus faibles taux d’embarquement. Pour le scénario d’une seule clé, nos résultats sont meilleurs que tous les autres stéganaliseurs, dont ceux basés sur des RNC, et nous pouvons mettre en échec de nombreux outils de stéganographie. L’information encodée par le vecteur final de caractéristiques est si discriminant, que la partie de classification peut se réduire à deux neurones de sortie. Nous avons finalement évalué la capacité de détection de notre RNC contre deux algorithmes de stéganographie fonctionnant dans le domaine spatial, et un dans le domaine fréquentiel. Nous avons obtenu un stéganalyseur parfait pour un taux d’embarquement de 0,4 bit par pixel, et ce pour tous les algorithmes considérés dans cet article. Des résultats intéressants, quoique moins surprenants, ont aussi été obtenus avec un taux d’embarquement de 0,1 bpp.

Discussion et conclusion

Les résultats obtenus sont très encourageants, et ils améliorent les résultats obtenus jusqu’à présent dans l’apprentissage approfondis pour la stéganalyse. Ces résultats nous permettent d’envisager l’utilisation de la stéganographie pour la télémédecine, comme l’ajout d’une marque fragile dans des documents médicaux, pour en garantir leur authenticité, ou l’insertion des informations de patients dans des images médicales.

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

使用大卷积滤波器的卷积神经网络隐写分析，用于嵌入具有相同隐写键的过程:用于远程医疗的深度学习方法

我们方法的“卷积”部分从仅使用一个滤波器的全局滤波开始，然后是第二个卷积层，通过使用宽滤波器产生一组减少的高质量特征（512×512像素的256个特征）。结果：所提出的架构包含比文献中通常发现的更少的卷积。滤波器在卷积的最后一层更宽，整个网络更通用：它允许考虑更宽的图像和更低的装载率。对于单键场景，我们的结果优于所有其他隐写器，包括基于RNC的隐写器。我们可以击败许多隐写工具。由最终特征向量编码的信息是如此有区别，以至于分类部分可以减少到两个输出神经元。最后，我们评估了RNC相对于两种在空间域和一种在频域中工作的隐写算法的检测能力。对于本文中考虑的所有算法，我们获得了每像素0.4位嵌入率的完美隐写分析仪。在0.1 bpp的入职率下也获得了有趣但不太令人惊讶的结果。讨论和结论获得的结果非常令人鼓舞，并改善了迄今为止在隐写分析深度学习中获得的结果。这些结果使我们能够考虑在远程医疗中使用隐写术，例如在医疗文件中添加脆弱的标记，以确保其真实性，或将患者信息插入医学图像中。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文去求助

来源期刊

European Research in Telemedicine / La Recherche Européenne en Télémédecine

自引率

0.00%

发文量