ドキュメントを確認し、機密段落を削除して送信しました。
しかし、削除しなかったのは、Microsoft Wordによって記録された47分の編集時間、最初の草稿を書いた同僚の名前、元々どの共有ドライブから来たのかを示すネットワークパスです。
その情報はまだ残っています。それはメタデータと呼ばれ、ほとんどのファイルに含まれています。
これは理論的なリスクではありません。2019年、ドナルド・トランプの元キャンペーンマネージャーであるポール・マナフォートを代表する弁護士たちは、特別顧問ロバート・ミューラーのチームに対する裁判所文書を提出しました。機密部分は太い黒いバーで覆われていました。しかし、ファイルから元のテキストは削除されていませんでした。記者が黒塗りされた部分をハイライトし、それをコピーして空白のドキュメントに貼り付けると、隠された内容が瞬時に現れました。数時間以内にその話は一面のニュースとなりました。
このガイドでは、主要なファイルタイプごとに隠されているもの、それが何を明らかにするか、そして共有前にそれを削除する方法を説明します。
目次
ドキュメントのメタデータとは?
メタデータとはデータに関するデータです。ファイルに埋め込まれた情報で、どのように作成され、誰が作成し、時間の経過とともに何が起こったかを説明します。通常、オペレーティングシステムや使用するソフトウェアによって自動的に生成され、記録されていることを示す目に見える兆候はほとんどありません。
ほとんどの人に関連する2つのカテゴリがあります。
システムメタデータ. OSやアプリケーションによって記録されるもの:著者名、作成日、最終更新日、ファイルサイズ、使用されたソフトウェアバージョン。
埋め込みメタデータ. アプリケーション自体によって記録されるもの:リビジョン履歴、コメント、トラッキングされた変更、GPS座標(写真の場合)、編集時間、内部ネットワークパス。
通常の使用ではほとんど見えません。特定のパネルを開いたり、専用のツールを使用したりしないと見ることができません。しかし、どこを見ればよいかを知っている人は、送信したファイルからそれを抽出することができ、実際に多くの人がそうしています。
Word文書 (.docx)
Wordは一般的に使用される中で最もメタデータが豊富なフォーマットです。典型的な.docxファイルには以下が含まれることがあります。
- 著者名と会社名. ドキュメントが作成された時点でのWindowsまたはMicrosoft 365アカウント設定から取得されます
- 最終編集者. 最も最近の編集者の名前
- リビジョン数. ドキュメントが保存された回数
- 総編集時間. このドキュメントがアクティブな状態でWordが開かれていた累積時間(分単位)
- 作成および修正のタイムスタンプ
- トラック変更. トラッキングがアクティブな状態で行われたすべての編集、削除されたテキスト、挿入、および各変更を行った人、たとえ「すべて承認」がクリックされたとしても
- コメント. 解決済みおよび削除されたコメントを含み、これらはしばしば回復可能です
- テンプレートパス. ドキュメントテンプレートの内部ファイルパスで、ネットワーク共有名やフォルダ構造を明らかにすることがあります
- 以前の著者名. 既存のファイルから再利用されたドキュメントの場合、元の著者の名前が残ることがあります
なぜ重要なのか: トラック変更とコメントは、偶発的な情報漏洩の最も一般的な原因です。弁護士、コンサルタント、契約交渉者は、ドラフト中にWord文書を頻繁に交換します。「すべて承認」がクリックされた後、トラッキングされたリビジョンは見えるドキュメントから削除されます。しかし、他のメタデータ、コメント、ドキュメントプロパティ、編集履歴は、ファイルがDocument Inspectorで明示的にクリーンされない限り、残ることがあります。
ある記録されたケースでは、クライアントを代表する法律事務所が、対抗弁護士にトラック変更が見える状態でWord文書を送信しました。クライアントの主張する立場と矛盾する変更がありました。エラーは発見されましたが、ケースの交渉ポジションへのダメージは即座に生じました。
確認方法: Wordでは、ファイル → 情報 → 問題の確認 → ドキュメントの検査に移動します。Document Inspectorはすべてのカテゴリの隠れたデータをスキャンし、選択的に削除することができます。
PDFは「クリーン」フォーマットであると広く信じられています。Wordの混乱を取り除く最終出力です。これは部分的に正しいですが、PDFにも意味のあるメタデータが含まれています。
- 著者、タイトル、主題、キーワード. PDFを作成するために使用されたWord文書から自動的に入力されることが多いです
- 作成アプリケーション. ファイルを作成または変換するために使用されたソフトウェア(例:「Microsoft Word 16.0」または無料のオンラインPDFコンバーターの名前)
- 作成および修正日
- XMPメタデータ. 多くのPDFに埋め込まれた拡張メタデータ標準で、より詳細なドキュメント履歴を含みます
- 注釈とコメント. 隠されたものや解決済みとしてマークされたものを含みます
- 不適切に編集されたテキスト. PDFエディターでテキストに描かれた黒いボックスは、ファイルの構造内でテキストを読み取れる状態に残すことが多いです
編集の問題は特に注意が必要です。 2019年1月、ポール・マナフォートの弁護士は、特別顧問ロバート・ミューラーのチームに対する連邦裁判所での回答を提出しました。ドキュメントには、マナフォートのロシア工作員との接触やトランプキャンペーンに関する詳細が含まれていましたが、法的チームはテキストの上に黒いボックスを描いただけで、ファイルから元の内容を削除していませんでした。どの読者でも黒塗りされた部分をハイライトし、コピーして新しいドキュメントに貼り付けることで、すべてを読むことができました。提出が公開されて数時間以内に、記者たちは隠されたテキストを抽出して公開しました。
この種のエラーは驚くほど一般的です。ワードプロセッサでテキストの上に黒い長方形を描いたり、背景色を変更したりすることは、最終的なPDF出力からテキストを確実に削除するものではありません。それはしばしば視覚的にしか覆いません。適切な編集には、ファイル構造から元の内容を永久に消去する専用ツールが必要であり、単にそれを覆い隠すだけではありません。患者やクライアントのデータを収集し、PDFメタデータのリスクを完全に回避したい場合は、PDFをオンラインフォームに変換することで、提出物を最初から構造化された制御環境に保つことができます。
確認方法: Adobe Acrobatでは、ツール → 編集 → ドキュメントの消去に移動して、すべてのメタデータを永久に削除します。無料のオプションとして、PDFに印刷(ファイル → 印刷 → PDFとして保存)すると、ほとんどのメタデータが削除されますが、共有する前にメタデータビューアで確認してください。
Excelスプレッドシート (.xlsx)
ExcelスプレッドシートはWordと同様のメタデータを持っていますが、フォーマットに特有の追加のリスクがあります。
- 著者と会社名
- リビジョン履歴と編集時間
- コメントとノート. 現在のビューで見えないものを含みます
- 隠された行と列. Excelの非表示機能を使用して隠されたデータは、ファイル内に残り、誰でもそれを表示することができます
- 隠されたシート. 全体のワークシートが隠されていても、ファイル内に残ります
- 名前付き範囲と数式. 共有する意図のない内部データ構造や計算ロジックを露出することがあります
- 外部リンク. 内部ネットワークパスやクラウドストレージ構造を明らかにすることができる他のファイルへの参照
隠された行とシートは、偶発的な情報漏洩の特に一般的な原因です。 クライアント向けの価格モデルを準備するコンサルタントは、送信前にコストとマージンの行を隠すかもしれませんが、それらの行はファイル内に残っています。それを表示するのに2クリックしかかかりません。
競争的な調達プロセスでは、サプライヤーがExcelベースのRFPテンプレートを受け取ることがあります。調査すると、購入者の内部スコアリング基準や目標価格範囲が含まれている隠されたシートが見つかることがあります。これは購入者の組織を離れることを意図していない情報です。
確認方法: Excelでは、ファイル → 情報 → 問題の確認 → ワークブックの検査に移動します。特に隠された行、列、シートに注意してください。
画像 (JPG, PNG, HEIC)
写真にはEXIFメタデータが含まれています。これは画像に関する技術的および文脈的な情報を記録するための標準化されたフォーマットです。
- GPS座標. 緯度、経度、時には高度。現代のスマートフォンでは数メートル以内の精度があります
- タイムスタンプ. 写真が撮影された正確な日時
- デバイス情報. カメラや電話のメーカー、モデル、時にはシリアル番号
- カメラ設定. 絞り、シャッタースピード、ISO、焦点距離
- ソフトウェア. 使用された編集ソフトウェアとバージョン番号
GPS座標は多くの人にとって最も重要です。自宅で撮影し、メールで送信したドキュメントの写真には、ファイルに自宅の住所が埋め込まれています。機密のクライアント会議で撮影した写真は、その会議が行われた場所を明らかにします。医療環境では、患者のドキュメントの写真はHIPAAの対象となります。使用するツールが患者データを収集する際にHIPAAが実際に要求するものを参照してください。[/blog/hipaa-compliant-online-form-healthcare/]
リスクは記録されており、現実です。2012年、ジョン・マカフィーは、ベリーズ当局から逃亡中に、彼に同行していたジャーナリストがオンラインで公開した写真にGPS座標が残っていたため、グアテマラで発見されました。座標は彼の位置を数メートル以内に特定しました。(マカフィー自身は後に、GPSデータが当局を誤導するために意図的に偽造されたと主張しましたが、それにもかかわらず拘束され、その後追放されました。)
Consumer Reportsの研究者たちは、より日常的な文脈で同じリスクを記録しています。再販プラットフォームで自宅でアイテムを撮影する売り手は、リスティング写真に自宅の住所を埋め込んでおり、EXIFデータを抽出することでどの購入者でも見ることができます。
確認方法: Windowsでは、任意の画像を右クリック → プロパティ → 詳細タブ。Macでは、プレビューで開く → ツール → インスペクタを表示 → GPSタブ。多くのスマートフォンも、特定のアプリを通じて写真を共有する際にGPSデータを削除しますが、すべてではなく、一貫しているわけでもありません。
削除方法: Windowsでは、右クリック → プロパティ → 詳細 → 「プロパティと個人情報を削除」。Macでは、プレビューのエクスポート機能を使用し、メタデータ削除を有効にします。バルク処理には、ExifTool(コマンドライン)やクライアントサイドのブラウザツールを使用して、複数のファイルからEXIFを一度に削除できます。
PowerPointプレゼンテーション (.pptx)
PowerPointプレゼンテーションは、WordやExcelと同様のメタデータを持っていますが、フォーマット特有の追加があります。
- 著者と会社名
- リビジョン履歴と編集時間
- コメント. レビュー中に追加され、解決済みとしてマークされたものを含みます
- 隠されたスライド. 隠されているスライドはファイル内に残っており、表示することができます
- スピーカーノート. プレゼンター用にスライドに追加されたノートで、内部の話題、予想される反論、または対象者に意図していない価格ガイダンスを含むことがあります
- 埋め込まれたファイルとオブジェクト. PowerPointファイルには、独自のメタデータを持つ埋め込まれたExcelスプレッドシート、Word文書、または他のファイルが含まれることがあります
スピーカーノートは、プレゼンテーションで最も見落とされがちな情報漏洩リスクです。 PDFとして送信されたセールスデッキは、ほとんどのメタデータを削除しますが、直接送信された.pptxファイルは、すべてのプレゼンターによって追加されたすべてのノートを保持し、戦略的な話題やセールスリサーチ中に収集された対象者に関する情報を含みます。
確認方法: PowerPointでは、ファイル → 情報 → 問題の確認 → プレゼンテーションの検査に移動します。
共有前にメタデータを確認し削除する方法
Officeドキュメント(Word、Excel、PowerPoint)の最速の方法
Microsoftの組み込みのDocument Inspectorは、すべての主要なメタデータカテゴリをカバーしています。
- ファイルを開く
- ファイル → 情報 → 問題の確認 → ドキュメントの検査(またはワークブックの検査 / プレゼンテーションの検査)に移動
- スキャンしたいカテゴリを選択
- 検査をクリックし、削除したいカテゴリに対してすべて削除をクリック
ファイルのコピーでインスペクターを実行してください。一部の削除は元に戻せないため、内部記録用に完全な履歴を持つオリジナルを保持しておきたいです。
PDFの場合
- Adobe Acrobat Pro: ツール → 編集 → ドキュメントの消去. これにより、すべてのメタデータと隠れたコンテンツが永久に削除されます
- 無料の代替: PDFに印刷(ファイル → 印刷 → Microsoft Print to PDFまたはmacOS PDF)すると、ほとんどのメタデータが削除されますが、共有する前にビューアで確認してください
画像の場合
- Windows: 右クリック → プロパティ → 詳細 → 「プロパティと個人情報を削除」
- Mac: 写真アプリ → 画像 → エクスポート → 位置データをチェックしない
- 任意のプラットフォーム: クライアントサイドのブラウザツールで、EXIFデータをローカルで削除します。アップロードは不要です
メタデータビューアを使用して確認する
機密文書を送信する前に、クリーニング後にどのメタデータが残っているかを確認する価値があります。いくつかのクライアントサイドツールは、ファイルをアップロードせずにブラウザ内で直接メタデータを読み取ることができます。
- Officeドキュメントの場合: ファイルをローカルで処理するメタデータビューアを開く
- PDFの場合: クライアントサイドで動作するPDFメタデータビューア
- 画像の場合: オフラインで動作するEXIFビューア
重要な基準: ツールがファイルをローカルで処理し、リモートサーバーで処理しないことを確認してください。メタデータを確認するために機密文書をチェックしている場合、未知のサービスにアップロードすることは、既存のリスクを排除しようとしている間に新たなリスクを導入することになります。
アップロードの問題
メタデータ削除の皮肉な点は、多くの人が「PDFのメタデータをオンラインで削除する」と検索し、無料のウェブツールにドキュメントをアップロードし、クリーンなファイルを受け取ることです。メタデータは消えましたが、ドキュメントは聞いたことのない会社が運営するサーバーに送られました。
メタデータが本当のプライバシーの懸念である文書、つまり法的契約、財務モデル、医療記録、内部プレゼンテーションの場合、未検証のツールにアップロードする行為は、メタデータ自体よりも大きなリスクとなる可能性があります。
同じ論理が任意のファイル処理に適用されます。 最も安全なツールは、そもそもファイルを受け取らないツールです。ブラウザ内で完全に動作し、ローカルメモリでファイルを処理し、サーバーへのアップロードを行わないクライアントサイドツールは、このトレードオフを完全に排除します。そして、目標がドキュメントを処理するのではなくデータを収集することである場合、パスワード保護されたオンラインフォームは、提出物を完全に制御された環境に保ち、ファイルが手渡されることを避けます。
定期的に機密文書を扱い、ファイルをローカルで処理するブラウザベースのツールをお探しの場合、PlatoForms PDF Toolboxは、ファイルがデバイスを離れることなく、コアPDF操作(結合、分割、圧縮、再注文、パスワード保護および削除)を処理します。オンラインフォームを通じて機密データを収集する組織向けに、Trust Centerでは、暗号化標準やコンプライアンス認証を含む完全なセキュリティアーキテクチャをカバーしています。
まとめ: どこに何が隠されているか
| ファイルタイプ | 最も一般的な隠れたデータ | 最大のリスク |
|---|---|---|
| Word (.docx) | トラック変更、著者名、編集時間、コメント | 削除されたテキストがまだ回復可能 |
| 著者、作成アプリ、不適切に編集されたテキスト | 黒いボックスの「編集」でテキストがそのまま残る | |
| Excel (.xlsx) | 隠された行/シート、コメント、外部リンク | 隠された価格やマージンデータ |
| 画像 (JPG, HEIC) | GPS座標、デバイスモデル、タイムスタンプ | リスティング写真に自宅の住所 |
| PowerPoint (.pptx) | スピーカーノート、隠されたスライド、埋め込まれたファイル | セールスデッキの内部話題 |
すべてのフォーマットに共通するパターンは同じです。メタデータは自動的に、見えない形で、継続的に生成されます。削除の負担は、ファイルを共有する人に完全にかかっており、ほとんどのツールはそれを簡単にしているため、送信前に確認しない理由はありません。
どんなドキュメントを送信する前に: 見える以上のものが含まれていると仮定し、共有前に確認してください。
参考文献
- Kaspersky, How ephemeral metadata may cause real problems, kaspersky.com/blog/office-documents-metadata/14215/
- CPO Magazine, Over Half of Fortune 500 Companies Are Leaving Sensitive Information Open to Reconnaissance via Document Metadata, cpomagazine.com
- Microsoft Support, Remove hidden data and personal information by inspecting documents, support.microsoft.com
- BigHand, The Importance of Metadata in the Legal Industry, bighand.com
- Columbia Journalism Review, Thank you to everyone who can’t redact documents properly, cjr.org/analysis/manafort-mueller-redacted-document-ukraine.php
- Wikipedia, Exif, en.wikipedia.org/wiki/Exif
- ISACA, What to Know About EXIF Data: A More Subtle Cybersecurity Risk, isaca.org, 2025
- Consumer Reports, How a Photo’s Hidden ‘Exif’ Data Exposes Your Personal Information, consumerreports.org
定期的に機密文書を扱っていますか?PlatoForms PDF Toolboxは、ファイルを完全にブラウザ内で処理します。アップロードなし、サーバーなし、アカウント不要です。
ドキュメントではなくオンラインフォームを通じて機密データを収集する場合は、オンラインで処理してはいけない5種類のファイルをお読みください。そして、PlatoFormsのフォームプラットフォームの背後にあるセキュリティアーキテクチャをカバーするTrust Centerをご覧ください。