ユーザー画像という概念は、インタラクションデザインの父であるアラン・クーパーによって提唱されました。彼は、ユーザー画像は実際のユーザーの仮想的な代表であり、一連の実データに基づいたターゲットユーザーモデルであると言っています。ユーザー画像を覚えておくことは、仮想的な代表を使って私たちの大部分のユーザーを表現することです。情報分析者の小編が言いたいことをもっと直接的に言うと。
創業者がどのようにユーザー画像を作成するか、皆さんが覚えておくべきことは、私の重要なユーザー、コアユーザーがどのようなものであるかを知ることです。性別は?何が好きなのか?あるいは、あなたのコアユーザーを一言で表現できるかどうか、ユーザー画像は、さらにはインターネット企業の核兵器です。
例えば、テンセント、バイドゥ、アリババ、この 3 つの会社は BAT と呼ばれています。BAT の最も重要な能力は、私が考えるに、大データのユーザー画像能力です。もう一つの話をしましょう。皆さんもご存知のように、テンセントは製品を作るのが非常に強いです。もしあなたが製品を作り、テンセントに注目されたら、テンセントも製品を作り、すぐにあなたを超えることができます。なぜでしょうか?それは、テンセントが非常に強力なユーザーの掘り起こし能力を持っているからです。
例えば、テンセントの技術は T1、T2、T3、T4、T5 に分かれています。T5 はチーフサイエンティストに相当し、基本的には一人か二人です。T4 にはテンセントに多くの人がいて、数十人います。T4 とは何か?テンセントが呼ぶ T4 専門家グループで、一般的に T4 に入るのは、億回以上のユーザー運用を経た技術の達人です。テンセントが問題に直面したときは、T4 専門家グループに頼ります。このユーザー画像に特化した T4 専門家グループに……
ユーザー画像は非常に強力で、核兵器のようです。ここで第二の核心点について話しましょう。どうやってやるのか?創業者は、彼自身がプロダクトマネージャーではない場合、どのようにユーザー画像を作成するのでしょうか?シードユーザーを見つけることです。
多くの人がシードユーザーとは何かと言います。ユーザーは階層化されており、ユーザーには何があるかを知っています。ターゲットユーザーがあり、その中にコアユーザーがいます。コアユーザーの中には何があるか?それがシードユーザーです。シードユーザーは種のように、ユーザーの中の意見リーダーであり、彼らはユーザーの中で発言権を持つ人々であり、コアユーザーの中の鍵でもあります。
ユーザー画像を作成するには、必ずシードユーザーを見つける必要があります。製品を作る際にもシードユーザーを見つける必要があります。皆さんもご存知のように、シードユーザーはほぼすべての会社が製品を作る際の第一歩です。例えば、小米のシードユーザーは何ですか?小米は現在、中国国内で非常に多くのスマートフォンを販売している会社で、小米のシードユーザーは熱心なファンです。
しかし、Huawei の販売も国内で一、二を争っていますが、Huawei の主流ユーザーは何ですか?小米と同じですか?違います。Huawei のシードユーザーはビジネスエリートです。
次に OPPO を見てみましょう。OPPO の販売も国内で一、二を争っていますが、OPPO のユーザー画像は彼らと同じですか?違います。OPPO のユーザー画像は若い女性です。ですので、シードユーザーを見つけることが非常に重要です。シードユーザーが天下を取るのです。
- ユーザー画像とは何か
ユーザー画像は、一連の実データに基づいたターゲットグループのユーザーモデルであり、ユーザーの属性や行動特性に基づいて、対応するラベルを抽象化し、フィットさせた仮想的なイメージです。主に基本属性、社会属性、行動属性、心理属性を含みます。
注意すべきは、ユーザー画像は共通の特徴を持つユーザーをクラスタリング分析した結果であり、特定の具体的な個人を対象としたものではないということです。
ユーザーラベルの集合
- ユーザー画像のステップ
(1)画像の目的を明確にする
画像の目的を確認することは非常に基本的であり、重要なステップです。ユーザー画像を構築する際に、どのような運営やマーケティング効果を期待しているのかを理解し、ラベル体系の構築時にデータの深さ、広さ、タイムリーさについて計画を立て、基盤設計が科学的かつ合理的であることを確保する必要があります。
(2)データ収集
客観的で実際のデータに基づいて構築された画像のみが有効です。データを収集する際には、業界データ、全ユーザーの総データ、ユーザー属性データ、ユーザー行動データ、ユーザー成長データなど、さまざまな次元を考慮する必要があります。また、業界調査、ユーザーインタビュー、ユーザー情報の記入、アンケート、プラットフォームのフロントエンドおよびバックエンドデータ収集などの方法を通じて取得します。
(3)データクレンジング
収集したデータには、ターゲットでないデータ、無効なデータ、虚偽のデータが含まれている可能性があるため、原始データをフィルタリングする必要があります。
(4)特徴エンジニアリング
特徴エンジニアリングは、原始データを特徴に変換することができる、いくつかの変換と構造化の作業です。このステップでは、データの異常値を除外する必要があります(例えば、e コマースアプリでは、ユーザーが秒殺の手段で数セントの価格でスマートフォンを取得することがあるが、ユーザーの日常の買い物の単価は千元以上である)し、データを標準化する必要があります(例えば、消費者が買い物に使用する通貨には人民元と米ドルが含まれるため、通貨を統一する必要があります)および判断のラベルを標準化します。
画像構築に使用される技術には、データ統計、機械学習、自然言語処理技術(NLP)などがあります。具体的な画像構築方法は、本章の後の部分で詳しく紹介します。
ユーザー画像の構築技術
(5)データラベリング
このステップでは、得られたデータを構築されたラベルにマッピングし、ユーザーのさまざまな特徴を組み合わせます。ラベルの選択は、最終的な画像の豊かさと正確さに直接影響を与えるため、データラベリングの際にはアプリ自体の機能と特徴と結びつける必要があります。例えば、e コマースアプリでは価格感度に関連するラベルを詳細化する必要がありますが、情報系ではできるだけ多くの視点からラベルを使用してコンテンツの特徴を説明する必要があります。
優先順位付けの方法は、構築の難易度と各種ラベルの依存関係に基づいており、優先順位は図のようになります。
各種ラベルの構築優先順位
(6)ユーザー画像の構築
ラベルを 3 つのカテゴリに分けます:
第一のカテゴリは人口属性
人口属性には、年齢、性別、学歴、人生の段階、収入レベル、消費レベル、所属業界などが含まれます。
性別 | 男 |
女 | |
不明 | |
年齢 | 12 以下 |
12-17 | |
18-19 | |
20-24 | |
25-29 | |
30-34 | |
35-39 | |
40-44 | |
45-49 | |
50-54 | |
55-59 | |
60-64 | |
65 以上 | |
不明 | |
月収 | 3500 元以下 |
3500-5000 元 | |
5000-8000 元 | |
8000-12500 元 | |
12500-25000 元 | |
25001-40000 | |
40000 元以上 | |
不明 | |
婚姻状況 | 未婚 |
既婚 | |
離婚 | |
不明 | |
業界 | 広告 / マーケティング / PR |
航空宇宙 | |
農林化学 | |
自動車 | |
コンピュータ / インターネット | |
建設 | |
教育 / 学生 | |
エネルギー / 採掘 | |
金融 / 保険 / 不動産 | |
政府 / 軍事 / 不動産 | |
サービス業 | |
メディア / 出版 / エンターテイメント | |
医療 / 保険サービス | |
製薬 | |
小売 | |
通信 / ネットワーク | |
旅行 / 交通 | |
その他 | |
教育レベル | 中学校以下 |
高校 | |
専門学校 | |
短期大学 | |
大学 | |
修士 | |
博士 |
人口ラベル
第二のカテゴリは興味属性
ユーザーの興味画像を構築する前に、ユーザーの行動内容に対してコンテンツモデリングを行う必要があります。興味画像が一定の正確性を持ち、かつ良好な一般化性を持つことを保証するために、階層化された興味ラベル体系を構築し、同時にいくつかの粒度のラベルを使用してマッチングを行い、ラベルの正確性と一般化性を保証します。
階層化された興味ラベルをどのように構築するか?一般的に、ユーザーがどのコンテンツや事物に興味を持っているかを見て、興味のあるコンテンツや事物を抽出し、ラベル付けし、統計を取ります。
第三のカテゴリは地理属性
常駐地の掘り起こしは、ユーザーの IP アドレス情報に基づいて行われ、ユーザーの IP アドレスを解析し、対応する都市にマッピングし、ユーザーの IP が出現した都市を統計することで常駐都市ラベルを得ることができます。
ユーザーの常駐都市ラベルは、各地域のユーザー分布を統計するためだけでなく、ユーザーが各都市間を移動する軌跡に基づいて出張者や観光客などを識別することもできます。以下の図は、人々の移動軌跡の一例です。
人々の移動軌跡
GPS データは通常、スマートフォンから収集されますが、多くのスマートフォンアプリはユーザーの GPS 情報を取得する権限を持っていません。ユーザーの GPS 情報を取得できるのは、主に百度地図や滴滴打車などの移動ナビゲーションアプリです。また、収集されたユーザーの GPS データは比較的希薄です。
百度地図はこの方法を使用して、時間帯データと組み合わせてユーザーの会社と自宅の GPS ラベルを構築しました。さらに、百度地図は GPS 情報に基づいて、各道路の車両流量を統計し、道路状況分析を行っています。以下の図は北京市のリアルタイム道路状況図で、赤色は混雑した道路を示しています。
北京のリアルタイム道路状況図
(7)画像を生成する
データがモデル内で実行された後、最終的に生成された画像は、以下の図のような可視化形式でユーザー画像を示すことができます。ユーザー画像は一成不変ではないため、モデルには一定の柔軟性が必要であり、ユーザーの動的行動に応じて画像を修正および調整することができます。
情報収集#
プライバシー#
パケットキャプチャ情報
積極的に参加するトピック(社会的事件に関する議論や経験)
好きな絵文字や emoji、参加しているグループやチャンネル
発言(身分、生活、職業、生活習慣、職場、愚痴、収入、価値観、立場など)
文体(表現方法、文の構造、句読点など)
スクリーンショットの内容(フォント、アプリのページ、上部通知バーのアイコンなど)
共有されたリンクや画像(参考)
写真(人、物、場所、象徴的な物体、天候、光、身分情報など)
社会的活動の写真(名称、開催時間、ポスター、宣伝文句)
地域の特徴(特産物、タバコ、トーテム、植物、地形)
音声(アクセント、方言、年齢、環境雑音)
共有ファイル(メタデータ、隠しウォーターマーク、元画像の exif 情報、ファイルの出所、内容)
アカウント情報(アバター、ユーザー名、署名 / プロフィール、パスワード、異なるプラットフォームで同じ情報を使用)
(国内のさまざまなプラットフォームが続々と IP の属地情報を表示し始めていますが、全体的に見て、これらの表示された属地の製品ドメイン名を収集し、一括コピーして追加することでプライバシーを保護するプロジェクトはありませんか?)
解決策👇
哔哩哔哩 IP 位置情報 API#
host, api.bilibili.com, Location IP
知乎 IP 位置情報 API#
ip-cidr, 103.41.167.0/24, Location IP
微博 IP 位置情報 API#
host-suffix, api.weibo.cn, Location IP
贴吧 IP 位置情報 API#
host,www.baidu.com,Location IP
头条 IP 位置情報 API#
host-suffix,toutiaoapi.com,Location IP
抖音 IP 位置情報 API#
host-keyword,core-c-lq,Location IP
host-keyword,core-lq,Location IP
host-keyword,normal-c-lq,Location IP
host-keyword,normal-lq,Location IP
host-keyword,search-quic-lq,Location IP
host-keyword,search-lq,Location I
1 枚の写真で具体的な位置を推測する方法|ネット迷踪入門ガイド#
前書き#
本格的なチュートリアルを始める前に、いくつかの点を説明する必要があります:
- この記事では、「ネット迷踪」と呼ばれる、1 枚の写真と限られたヒント情報だけで写真が撮影された具体的な場所を推測する推理ゲームについて紹介します。これは、合法的に公開されているリソースからデータや情報を収集する行為であるオープンソースインテリジェンス(OSINT)の一形態と見なすことができます[1]。
- この記事では、「場外情報」を取得し分析する方法、例えば「地元の人は一目でわかる」や、出題者の過去のコンテンツやソーシャルプラットフォームからその身元や居住地情報を取得する方法については紹介しません。この記事は、「ネット迷踪」において「人肉検索」など他人のプライバシーを侵害する行為を使用することを奨励するものではありません。
- 著者自身は「ネット迷踪」の愛好者であり、本文中で言及されているソーシャルプラットフォームやツールとの間に利益関係はありません。また、著者はアマチュアプレイヤーであり、以下の内容は個人的な経験の要約であり、厳密で専門的なチュートリアルではありません。この文章がこのゲームに興味を持つ一部の人々の入門に役立つことを願っています。また、公開チャネルで写真を公開することがもたらすプライバシーリスクを認識する手助けにもなればと思います。
1 枚の写真で、あなたの場所を知ることができるのか?|ネット迷踪の初探「ネット迷踪」は、オープンソース調査の中で最も影響力のある形式であり、非常にドラマチックに見えます:1 枚の画像で正確に位置を特定できます。しかし、このドラマチックさは、1 枚の画像が含む情報量や、インターネットのオープンソース情報の規模と広がりを人々が過小評価していることから生じています。
編注:この記事は「一般の人々が 1 枚の写真を通じて現実の場所を逆推測するプロセス」を普及させることを目的としており、読者に警鐘を鳴らすことを希望しています。読者がこの記事に基づいて探索や研究を行う場合は、他人のプライバシーや関連法規を尊重することに注意してください。
2011 年、「私はどのように王珞丹の住所を推測したのか?」というタイトルの投稿が大々的に転載されました。投稿者は、王珞丹のいくつかの微博、北京の知識、Google Earth を利用して、40 分で王珞丹の前の住所を推測しました。(王珞丹は当時大ヒットした職場ドラマ「デュラララ昇進記」の主演であり、人気女優です。年齢を暴露する著者注。)GGMM たちは「すごい」と驚きつつ、自分も調査されるのではないかと心配し、二度とネットに何かを投稿できないと表明しました。
関連報道。画像出典 搜狐传媒
10 年後の 2021 年、多くの愛好者やクリエイターの紹介を受けて、「ネット迷踪」と呼ばれる探偵ゲームが一般の視野に入ってきました:わずか 1 枚の画像とわずかなヒントの条件下で、達人たちはネットに接続されたコンピュータだけで画像の撮影地を見つけることができ、撮影時間を特定できる人もいます。現在のネットユーザーたちは「すごい」と驚きつつ、自分も調査されるのではないかと心配し、二度とネットに何かを投稿できないと表明しました。
炒飯コミュニティのネット迷踪板。画像出典 炒飯コミュニティ
B 站の UP 主「私は EyeOpener」は、影響力のあるネット迷踪の紹介者の一人です。画像出典 bilibili
インターネットの歴史は「循環の繰り返し」であり、しかしその循環は螺旋的に上昇しています。10 年間で世界のインターネットユーザー数は倍増し、ウェブページの数は 4 倍になりました。私たちはあまり進歩していませんが、この調査技術は膨大なインターネット情報の支えを受けて、ますます成熟しています。その正式な名前はオープンソース調査(Open Source Investigations, OSI)またはオープンソースインテリジェンス(Open Source Intelligence, OSINT)[注釈 2]であり、インターネット上のオープンソース情報を利用して調査を行う技術を指します。
「ネット迷踪」はオープンソース調査の中で最も影響力のある形式であり、非常にドラマチックに見えます:1 枚の画像で正確に位置を特定できます。しかし、このドラマチックさは、1 枚の画像が含む情報量や、インターネットのオープンソース情報の規模と広がりを人々が過小評価していることから生じています。あなたは自分の写真がプライバシーを暴露することを心配していますか?探偵たちがどのように糸を解きほぐして撮影者の位置を導き出すのか興味がありますか?今日は、この記事を通じて、あなたもネット迷踪の神秘のベールを剥がし、ネット探偵になり、自分自身のネットコンテンツの安全専門家になることができます。
ネット迷踪の遊び方#
炒飯コミュニティは、掲示板のような興味を集めるソーシャルサイトで、そのネット迷踪板は業界内で非常に影響力があります。毎日、多くの飯友がここで自分が撮影した写真を投稿し、「探偵たち」に挑戦を発信します。モデレーターチームは定期的にネット迷踪のポイントコンペを開催し、勝者には素晴らしいトロフィーが贈られます。(広告ではありません、特に声明します。)
炒飯コミュニティネット迷踪板の内容。画像出典 炒飯コミュニティ
すべての画像が謎解きに適しているわけではありません。炒飯コミュニティでは、謎解きの画像は都市の建物、交通機関(特に飛行機や新幹線)、道路、観光地などのいくつかのカテゴリに集中しており、遠景が主です。自分のテーブルの上の置物や、道端の小さな花や草の写真を撮っても、探偵たちは画像の内容から有効な情報を得るのは非常に難しいです。
ネット迷踪の謎は、パノラマ画像や動画などのマルチメディア形式でもあります。少数派が紹介したGeoGuessrや、百度地図が提供する「パノラマ都市探検家」などは、パノラマ画像を媒体としています。
ネット迷踪の基本的な考え方は、以下の 3 つのステップに分けられます:
- 抽出:画像を注意深く観察し、すべての有効な情報を抽出します。どんなに小さくてぼやけていても見逃してはいけません;
- 分析:自分の知識とインターネットツールを利用して得られた情報を分析し、調査範囲を絞ります;
- 検証:インターネットツールを使用して調査を展開し、分析段階で得られた調査範囲を検索します。成功しなかった場合は、最初の 2 つのステップに戻って再試行します。
情報の抽出と分析はネット迷踪の鍵であり、その楽しさでもあります。これは探偵たちの広範な知識、強力なインターネット情報検索能力、長期的な経験の蓄積に依存しています。
ネット迷踪の探偵は、論理的推論を通じて答えを導き出すことを好み、推論プロセスが難しいほど、答えを得たときの達成感が強くなります。現実の複雑性を考慮すると、この推論プロセスは厳密ではなく、むしろ生活経験に基づく高確率の推測に過ぎません。
画像に隠されているものは?#
合格したネット迷踪の探偵になるための第一歩は、画像を見て、画像の隠れた情報を掘り起こすことです。一般的に、1 枚の画像には以下の情報が含まれる可能性があります:文字情報、基盤施設情報、自然地理情報。
文字情報#
文字情報は、地理的位置を推測する最も迅速かつ簡単な方法です。他の種類の情報と比較して、文字情報には大きな利点があります:
- 位置を直接示す可能性がある:標識、政府機関の建物、駅名、門牌番号などの文字情報は地理的位置と強く関連しており、簡単に得点問題になります。
- 専門的なハードルがない:植物の種類や飛行機のモデルを特定するには一定の専門知識と比較分析プロセスが必要ですが、文字情報を解読するにはそれらは全く必要ありません。文字を認識できれば十分です。
- 検索が容易:文字を直接検索エンジンで検索できます。多くの検索エンジンは画像検索をサポートしていますが、その正確性は文字情報には及びません。
したがって、ネット迷踪の探偵は、画像内のどんな文字情報も見逃しません。たとえそれがぼやけていても、一度は識別する必要があります。
例えば、以下の画像を見て、撮影者の位置を尋ねます:
これは沙県小吃店です。しかし、直接「沙県小吃」を検索するのは良いアイデアではありません — 全国に数万の沙県小吃店があります。画像の詳細を注意深く観察すると、いくつかの文字情報が見つかります:隣の「* 記」、窓の反射に「王府」「旺基」、門牌番号「香榭 」「23」、電動バイクの泥除けに「星橋モラカ専門店」の広告があります。
電動バイクはほとんど都市を跨いで移動しないため、そのナンバープレートと泥除けの広告から撮影地の都市を推測できます。ナンバープレートの都市名はぼやけていて、2 文字しか見えないため、泥除けから始めます。
全国的に「星橋」を検索し、「三星大橋」のような曖昧な一致を除外すると、残りの可能性は 12 件あります:浙江省杭州市星橋街道、湖州市星橋村、福建省三明市星橋村、福清市星橋村、四川省資陽市星橋村、広安市星橋村、広元市星橋村、重慶市星橋町、雲南省麗江市星橋村、湖南省邵阳市星橋村、株洲市星橋村、湖北省咸宁市星橋村。窓の反射から見ると、この場所は商業活動が活発で、普通の農村のようには見えません。
全国的な「星橋」(一部)。画像出典百度地図
広告には「モラカ専門店」の電話番号も記載されています。ご存知のように、我が国の電話番号の最初の 3 桁はキャリアを示し、中間の 4 桁は地域コードを示しますので、電話番号の最初の 7 桁で番号の帰属地を特定できます。これは必ずしも撮影者の所在地であるとは限りませんが、高い確率で本当です。
電話番号はぼやけていますが、最初の 7 桁の中で見える数字は「1508*64」で、5 桁目は 3、5、または 8 のようです。調べてみると、1508364 は江西省新余、1508564 は貴州省遵義、1508864 は浙江省杭州に属します。星橋の検索結果と照らし合わせると、杭州市だけが重なります。したがって、撮影者が杭州にいると仮定し、次の検索を開始します。
次に、門牌番号「香榭 」「23」に注意を向けます。門牌の内容は道路名、小区名、村名である可能性があります。近くの商業活動が活発であることを考慮すると、ここは道路名である可能性が高いです。「香榭」の後の内容は遮られており、比率の位置から見てまだ 1 文字残っているはずで、「路」や「街」のようなものであるべきです。
杭州市で「香榭路」を検索すると、確かに香榭という名前の道路が見つかり、星橋街道に属しています。
杭州市星橋街道香榭路。画像出典百度地図
この地域で沙県小吃を検索すると、「疑似ターゲット」となる店舗が見つかります:
疑似沙県小吃店。画像出典百度地図
残念ながら、ストリートビューは古く、画像に似た店舗を見つけることができませんでした。しかし、建物のスタイルと標識の形式は一致しています。
香榭路全景図。画像出典百度地図
美団でこの店舗を見つけることができ、門牌番号は「香榭路 23-1 号」で、店舗の画像は謎解きの画像と一致しています。これで、撮影者の位置が浙江省杭州市臨平区香榭路 23-1 号沙県小吃の近くであることが確定しました。
沙県小吃天都城店。画像出典美団
以上は、ネット迷踪の送分題の一例です。なぜなら、文字情報を分析するだけで答えを導き出すことができるからです。
基盤施設情報#
大きな都市から小さなゴミ箱まで、基盤施設は多岐にわたり、市政、交通、建築などの分野を含みます。基盤施設に基づいてネット迷踪を展開する理論的根拠は、以下の 2 点です:
- 識別性。工業社会の産物として、同じ機能を持つ基盤施設の外観は大体同じであるため、「これは何か」を識別することができます。港、空港、スタジアムなどの大型施設を特定することは、位置を特定する上で重要な役割を果たします。
- 地域差異性。国家や地域の政策、気候条件、経済地理条件の影響を受けて、基盤施設の間にも差異が存在します。これにより、「ここはどこか」を推測することができます。
一般的に使用される基盤施設情報を簡単に列挙します:
- ランドマーク:ランドマークは一般的に独特の特徴を持ち、画像検索を利用して都市を特定することができます。もし模倣者がいる場合、ニュース報道を利用しても見つけるのは難しくありません。
- 都市:中心都市、城中村、都市と農村の接合部のスカイラインや鳥瞰図はそれぞれ異なり、都市の規模の大きさもこれらの都市景観に影響を与えます。
- 建物:建物は一般的に南向きに建てられ、方向を判別するために使用できます。各地の農村の民家は異なるスタイルを持ち、赤瓦の尖った屋根、粉色の壁、洞窟、四合院などがあり、所在地域を推測することができます。
- 道路:異なる種類の鉄道や道路にはそれぞれ特有の施設があり、鉄道接触網、護岸、隔離網などがあります。鉄道駅や道路料金所、交差点、交通標識なども重要な手がかりです。独特のデザインの街灯も解決の突破口になる可能性があります。
- 車両:ナンバープレートは所在国を推測するのに役立ち、さらに特定の行政区まで精密に特定できることもあります。自動車が左側通行の場合、右側通行の国を排除できます。都市のバスやタクシーは通常、統一または系列の塗装を採用しています。
- 列車、飛行機:列車や飛行機の外観の詳細に基づいてそのモデルを特定できます。列車や飛行機の運行スケジュールはオンラインで確認できます。特別な塗装も重要な情報を明らかにすることができます。飛行機の写真の撮影角度に基づいて、飛行機が離陸または着陸しているかを大まかに判断できます。
- 特殊施設:気象観測所、レーダー局、スタジアム、港などには特殊な施設が常に存在し、スタジアム専用の照明灯や港のクレーンなどが含まれます。これらの特殊施設を識別するには、関連する知識が必要です。
基盤施設情報はネット迷踪の中で最も一般的で主要な情報の種類であり、本文ではすべてを網羅することはできませんが、ここでは基盤施設情報に基づいて位置を特定する典型的なケースを紹介します。これはオープンソース情報の専門家NixIntel のブログからのものです。この専門家のブログは国内のネット迷踪ブロガーに豊富な素材を提供しています。
第二の謎の画像、画像出典 Swapfiets 会社
これは Swapfiets 社が発表した広告写真で、写真の位置を探す必要があります。NixIntel は画像から以下の情報を抽出しました:
- これは高層ビルのある都市です。
- 道路の軌道は、その都市がトラムを運行していることを示しています。
- 一部のナンバープレートが見え、形式は PJ-620-* です。
- 照明柱には白黒のストライプがあります。
- 道路の左側の建物には目立つ細長い白い柱があります。
NixIntel はその会社の公式ウェブサイトを訪れ、その会社が当時オランダ、ドイツ、デンマーク、ベルギーの 4 カ国で運営されていることを知りました。具体的にどの国かを特定するには、ナンバープレートを使います。WorldLisencePlatesサイトには、世界各国のナンバープレートのスタイルが収録されています。上記の 4 カ国のスタイルは以下の通りです:
4 カ国のナンバープレートの比較。画像出典 WorldLisencePlates
比較すると、オランダのナンバープレートのスタイルが最も近いことがわかり、次のステップはオランダを検索することです。もしオランダでなければ、再度選択し直せば問題ありません。
国を特定した後、州や市に絞り込む方法はあるのでしょうか?先ほどの手がかりを振り返ると、トラムが良さそうです。なぜなら、すべての都市がトラムを運行しているわけではないからです。ウィキペディアのオランダのトラムページを調べると、オランダでは現在、トラムを運行している都市は 5 つしかありません:デルフト、ユトレヒト、ロッテルダム、アムステルダム、ハーグです。
オランダのトラムの項目、画像出典 ウィキペディア
大白柱の建物がここで役立ちます。おそらくこの 5 つの都市の中にあるでしょう。Phrioサイトには、世界中の大型建物が収録されており、都市ごとにフィルタリングでき、画像も付いています。デルフトのページは以下の通りです:
デルフトには明確に一致する建物が見つかりませんでした。建物の体積は一般的に広告写真ほど大きくありません。ユトレヒトにはいくつかの大きな商業ビルがありますが、やはり一致するものはありません。ロッテルダム、アムステルダム、ハーグははるかに大きく、答えはおそらくその中にあるでしょう。大規模な都市には大量の高層ビルがあるため、ロッテルダムのビルを見てみましょう:
ロッテルダムの高層ビルの一覧。画像出典同上
ブラウジングの後、見覚えのある建物が見つかりました。高くて白い柱が非常に目立ちます。それはユニリーバビルです:
ユニリーバビル。画像出典同上
ストリートビューに入り、見慣れた白黒の電線柱、トラムの軌道、道路を確認し、撮影地がここであることを確認しました。
ロッテルダムのストリートビュー。画像出典 Google Earth
このケースは、インターネットのオープンソース情報の強力さをよく示しています。専門知識を使わずに、いくつかの情報ポイントを抽出するだけで、インターネットの多様なリソースを利用して探索し、答えを導き出すことができます。これはネット時代が私たち一人一人に与えた超能力です。
自然地理情報#
一般的な自然地理情報には、光影、天候、地形、植物などがあります。自然地理情報を抽出して解読するには、博物館のような広範な自然地理知識の蓄積と、その基盤に基づく直感が必要です。多くの著名なネット迷踪のケースでは、重要なステップは大物の一言「この地域のように感じる」というものであり、その奥深さは言葉では伝えられません。
一般的に使用される自然地理情報には以下のものがあります:
- 地形:水域(河川、湖、貯水池、海)、山脈(積雪)、土壌の色など。
- 植物:植物は通常、特定の分布地域を持っており、目標範囲が不明な場合は植物情報を使用して排除することができます。しかし、広範な種の導入により、この排除はあまり信頼できません。
- 光影:影から大まかな方向を得ることができ、進行方向や道路の方向を判断することができます。Suncalcサイトを使用して、影の長さ、位置、時間を特定できます。画像の中で昼夜が明確に見えることが多く、これにより画像の日夜の状態に合わない班次を排除するのに役立ちます。
- 天候:天候は一般的な補助情報の一つです。所在地の過去の天候変化を考慮することで、撮影の日付範囲を推測できます。
- 人物:地理情報として考慮しても良いでしょう。画像に写っている人種に基づいて、画像の撮影地を推測できます。
このセクションでは、炒飯コミュニティのある投稿を例に挙げます。この問題は、炒飯コミュニティの 2 人の大物「鞍山のウー・ヤン・ズー」と「猫」(以下「猫」)が共同で解決したものです。問題の画像は以下の通りで、撮影者の位置を尋ねています。
第三の謎の画像。画像出典 炒飯コミュニティ
鞍山のウー・ヤン・ズーはこの画像の判断を次のように行いました:
天候と山の形状、植生から、北京の北部(東北三省や内モンゴルの一部を含む)であると判断しました。
遠くの家屋の赤瓦の尖った屋根と、前に似たようなトウモロコシの作物があることから、基本的に東北地域であると確定できます。
この判断プロセスは主に経験に基づいていますが、東北地域の範囲はまだ広いです。これは自然地理情報を推測する際の特徴でもあります:豊富な経験知識が必要ですが、範囲を狭めることはできません。
猫はさらに 2 つの判断を加えました:
左側の鉄道には照明灯と駅名プレートがあり、撮影位置は鉄道駅の近くであると推測しました。
遠くの民家は南北方向にあるはずで、北向きの帰線の影が南側にあることはあり得ないため、方位を次のように推測しました:
左側の鉄道はおおよそ南北方向に走っており、鉄道を横切る道はおおよそ東西南方向に走っており、交差点は駅から 500 メートル以内です。
これで、画像内の情報はすべて抽出されました。人力で東北地域のすべての鉄道交差点を検索することは可能ですが、時間コストが高く、見落としが生じる可能性があります。人間がこの作業を代わりに行うツールはあるのでしょうか?あります!オープンソース調査の分野で画期的な検索ツールを紹介します:Overpass Turbo。これは OpenStreetMap に基づく Web ベースのデータマイニングツールです。簡単に言うと、ユーザーが指定した位置関係に基づいて、すべての条件に合致する場所を検索できる地図検索エンジンです。国内ではあまり多くの興味点が収録されていませんが、鉄道関連情報は比較的完全です。
あまり早く興奮しないでください。以下の情報は、あなたをためらわせるかもしれません — これを使用するにはコードを学ぶ必要があります。Overpass Turbo は、Overpass API と呼ばれるクエリ文を使用します。
この例で使用するコアコードは以下の通りで、猫が提供したものです。私は高速鉄道の条件を引き入れて範囲を狭めようとしましたが、maxspeed フィールドに欠落があったため、ここでは元のコードを使用します。長さの制約上、簡単な注釈説明のみを提供します。興味のある読者は、自分で検索してチュートリアルを学ぶことができます。
// 検索エリア内で長さが 1 キロメートルを超える鉄道橋を検索し、w1 に保存
way[railway = rail][bridge](if: length() > 1000)({{bbox}}) -> .w1;
//w1 と交差する(距離 0)、長さが 1 キロメートルを超える非鉄道橋の鉄道を検索し、w2 に保存
way(around.w1: 0)[railway = rail][!bridge](if: length() > 1000) -> .w2;
//w1 の近く 500 メートル以内、w2 の近く 20 メートル以内のすべての鉄道駅を表示
node(around.w1: 500)(around.w2: 20)[railway = station];
東北地域は広いため、2、3 回に分けて検索できます。結果は以下の通りで、円でマークされたものがヒットしています:
Overpass Turbo の検索結果。画像出典炒飯コミュニティ
前述の鉄道の方向に基づいて、条件に合う駅を 1 つ絞り込むことができます:タファンチ駅。
タファンチ駅。画像出典炒飯コミュニティ、高德地図
このケースは自然地理情報に完全に依存しているわけではありませんが、それに基づいて所在地域を大幅に減少させることができました。Overpass Turbo を利用することで、迅速に広範囲を調査することが可能になります。
場外情報#
画像内の情報が不足している場合、探偵たちは場外のヒントを取得する必要があります。以下の各項目がプライバシーや法的問題に関わる場合は、必ず出題者または当事者の同意、または公式機関の許可を得た上で使用してください。
- 画像 EXIF 情報:出題者が元の画像を公開し、ネットプラットフォームが EXIF 情報を削除していない場合、この情報を通じて撮影地を直接特定できます。
- 出題者の履歴:出題者が公共のソーシャルプラットフォームに投稿した内容を確認します。個人のホームページやコメントを含めて、異なる公共のソーシャルプラットフォームで同じアバターやユーザー名を使用している場合、類似の内容を投稿していることが多く、クロスプラットフォームでの検索が容易になります。
- ソーシャルネットワークの関係:出題者の友人ネットワークも彼自身を暴露する可能性があります。彼と頻繁に交流している友人は、同じ生活経験、同じ興味、または同じ組織に属している可能性があり、友人が投稿した内容も彼自身に関連していることが多いです。
もう二度とネットに何かを投稿できない?#
ネット迷踪はプライバシーに関する疑問をしばしば受けます。公衆の疑念を避けるために、炒飯コミュニティや Twitter の @Quiztime は、出題者が自分の撮影した写真を投稿することを主にしています。しかし、悪意のある者が個人をターゲットにして調査を行うことも避けられません。したがって、皆さんがコンテンツを投稿する際には、いくつかの注意を払う必要があります。自分のすべての画像が撮影位置を暴露する可能性があると仮定してください。
- 公開プラットフォームですか?そのプラットフォームで私が投稿した内容を見る前に、友達になったり、私の同意を得る必要がありますか?誰でもアクセスできる情報を公開する際には非常に慎重になる必要があります。
- もし撮影地が知られた場合、核心的なプライバシーに関わりますか?自分が訪れた観光地や公共の場所を示すことは実際にはあまり影響がありませんが、撮影地があなたや友人の居住地、職場に関連している場合、画像に前述の情報を含めないようにし、文案も通勤や交通に関する記述を避ける必要があります。
- 国家安全に関連する画像を投稿しないようにしてください。例えば、武器や軍隊などです。
これらの点に注意すれば、基本的には王珞丹のように家を盗まれることはありません。
もし画像が核心的なプライバシーに関与していないが、撮影位置が調査されることを望まない場合は、次の点に注意してください:
- 同じ場所の複数の画像を投稿しないようにしてください。これはオープンソース調査に十分な情報を提供する可能性があります。
- 文字情報が多く含まれる画像を投稿しないようにしてください。
- 特殊な基盤施設情報や自然地理情報が含まれる画像を投稿しないようにしてください。
- 元画像を投稿しないようにしてください。
この記事を通じて、読者の皆さんはネット迷踪の基本的な遊び方を理解し、画像に含まれる重要な手がかりを分析できるようになったことでしょう。今すぐ自分の微博や友人のサークルを開いて、どの画像が自分の位置を暴露するかを分析し、自分自身のネットコンテンツの安全専門家になりましょう。
コーチ、私は学びたい#
プライバシーの安全を守る前提で、ネット迷踪は有益な謎解きゲームです。プレイヤーの知識を広げ、現実とネットへの理解を深め、推理能力や自発的な情報取得能力を鍛えることができます。
この記事は画像情報の抽出に重点を置いており、ネットリソースはあくまで補足的に言及しています。私の見解では、どの情報を検索できるかを知ることが、どのように検索するかよりも重要であり、これはほとんどの人がネット迷踪に参加する際の最大の障害です — 画像の中に重要な情報が存在することを認識できないことです。この障害を突破した後は、画像検索を利用してさらに情報を取得したり、これらの情報を紹介する専用のウェブサイトでフィルタリングしたりできます。もしどのウェブサイトがあるかわからなければ、検索したり、専用のフォーラムで質問したりすることができ、これらは徐々に経験を積んで解決できる問題です。
どのフォーラムで交流できますか?どの大物のブログを訪れることができますか?どのリソースが私を助けてくれますか?これらはあなたに残されたネット迷踪の問題です:前述の多くのヒントを提供しましたが、今は自発的な情報取得能力を鍛える時です。
あなたのネット探索の旅が順調であることを願っています!
注釈 [1]:この命名は 2018 年の映画「ネット迷踪」に関連している可能性がありますが、二者の「迷」の書き方には違いがあります。この映画は、エンジニアの父がインターネットを利用して失踪した娘を探す物語を描いています。
注釈 [2]:近い用語にはオープンソース調査(Open Source Investigations, OSI)やオンラインオープンソース調査(Online Open Source Investigations, OOSI)があります。これらは通常互換性があるため、この記事ではその違いを探求するつもりはありません。興味のある読者は自分で調べてください。
初入「ネット迷踪」#
2011 年、人人網の「ロシャオユ BHSFer」というユーザーが投稿した「私はどのように王珞丹の住所を推測したのか?」という記事が各メディアに転載され、著者は王珞丹の微博に投稿された写真や Google Earth などのツールを利用