Commons:ファイル名の付け方
ファイル名は、ファイルのURLや他プロジェクトにおける使用時の基礎となります。ここに示すファイル命名ガイドラインは、アップロード者がファイルに適切な名前を付けられるようにすることを目的としています。このページでは、適切なファイル名を付けるための推奨事項を示しますが、これ単体でファイル名を変更する正当な理由となることを意図したものではないことに注意してください。これらは ファイルの改名のガイドラインと併せて解釈し、ここで説明する原則とファイル名の変更にかかる手間とのバランスを取る必要があります。一般的に、名前の変更には大きな手間がかかるため[1]、コモンズは安定したファイル名を提供することを目指しており、名前の変更は制限されています。ウィキペディアの記事とは異なり、あるファイルに適切だと考えられる名前は複数存在することが多く、ファイルが上書きされたり更新されたりすることはほとんどありません[2]。これらの事項は、最初のアップロード時またはその後すぐに高品質なファイル名を選択することが重要であることを意味します。そうしないと、ファイル名が改善されない可能性が高くなります。
ファイル名の目的
名前は、対象となるアイテムを一意に特定するために用いられます。名前は以下の基準を満たすべきです。
- 説明的であること。その画像が何を撮影したものか、あるいは内容が何を描いたものなのかに応じて選ぶべきです。
- 正確であること。学名、固有名詞、年月日などを用いるときには特に重要です。
ファイルをカテゴリに分類する投稿者の要求は、ファイルの作成・処理・管理・アップロードを行う投稿者とは異なることがよくあります。やむを得ない理由がない限り、アップロード者が選んだ名前の方が尊重されるべきです。ただし、これはあくまで礼儀であり、絶対的な権利ではありません。もし名前が混乱を招いたり不適切だったりする場合は、別の名前にすることもできます[3]。
命名規則
メディアファイルは、任意の文字(UTF-8で符号化されます)・任意の言語の名前でアップロードできます。これについては使用言語の方針を参照してください。ファイル名の拡張子は、ファイル形式と一致する必要があり(例えばJPEG画像なら .jpg)、二重に書くことはできません(例えば .jpg.jpg や .tiff.jpg は不可)。ファイル名はファイルの内容を明確に説明する必要がありますが、適度に簡略化する必要もあります。ファイル名が適切だと判断されるかどうかは、その主題に対する個人の精通度に大きく依存します。また、人によって同じものを別の名称で呼んでいる場合や、ある投稿者が文化的な違いを無視して「これを説明する際はこの言葉が広く使われている」と信じている場合もあります。したがって、全ての投稿者が満足する一つの名前というのは存在しない可能性が高いです。以下に、適切なファイル名の様々な特徴を示します。これらは絶対的な規則ではなく、目標として捉えられるべきです。一般に、完璧なファイル名よりも、安定した(名前が変更されない)ファイル名の方が重要であり、これらの目標のいくつかを満たしていなくても、ファイルを移動する正当な理由にはなりません。ただし、迷った場合は、より一般的な、安定した名前を目指してください[4]。
説明的であること
- 意味があること – 名前は「DSC123456.jpg」のように、自動的に生成される英数字のみで構成されるべきではありません。コモンズはファイル名接頭辞ブラックリストとタイトルブラックリストを用いてこの方針を強制しています。
- 内容が重視されていること – 出所を示すことよりも主題の説明をすることを優先してください。日付、撮影者や権利者の名前、「Flickr」・「オリジナル」・「クロップ(切り取り)」といった言葉、カタログ番号のみで構成される名称は使用しないでください。例えばFile:20110428 OH K1023900 0014.JPG - Flickr - NZ Defence Force.jpg は、名前が長いにもかかわらず、主題をまったく説明していません。ただし、名称が合理的かつ簡潔で、主題の説明も含まれているなら、そのような情報を含めることは許容されます。撮影者の名前や出所の情報はファイルページに記載すべきであるということを忘れないでください。なお、小説『1984年』のように、日付で主題を特定できるようなものは例外です。
- 特定できること – 場所の画像の場合、アップロード者が撮影場所を知っていれば、その場所と画像の内容を示す名前にするべきです。例えば「上野動物園」、「ウォール街」、「ANIME EXPO 2022」のようにです。また、「File:Paris 319.jpg」、「オンタリオ州の丘」、「日本の駅」のような広すぎる名前は、その地域に詳しい人しか場所を特定できないため、使用すべきではありません。同様に、アイコンやクリップアートのように広い物事を対象とするイラストでない限り、名前は「スマートフォン」や「スクリーンショット」、「女王」、「鳥」といった一般的な言葉を用いるべきではありません。「Nokia N8 Blue (Front)」のように、ファイルに示されている物体を識別できる詳細な情報を含めるべきです。
- 区別できること – ファイル名は主題となるものを明確に説明し、同じような主題と区別できるものにすべきです。例えば File:Michaeljackson.jpg は、Category:Michael Jackson に含まれる他のファイルと区別できる情報を含んだ名前にすべきでした。場所の区別については、姉妹プロジェクトの Wikivoyage:Naming conventions § Disambiguation(英語)を参照してください。
- 正確であること – ファイル名はファイルの内容を説明し、対象物の実際の名称を伝える必要があります。不正確な名称なら、それが一般的であっても避けるべきです。例えば芸術家が自身の作品に付けたタイトルは、たとえ描かれているものと無関係であっても、適切であるとみなされます(例えば多くのダダイスムの作品)。また、固有名詞の誤字、日付の間違い、物体・生物の誤認など、明らかなミスがあってはいけません。利用者は未同定・未知の生物の写真をアップロードすることはできますが、同定された際にファイル名が変更される場合があります。
- 撮影日 – 写真が撮影された年・日付を含める。
明確であること
- 簡潔であること – 名前は必要以上に長くすべきではありません。通常は説明的なフレーズで十分です。ファイル名の長さは240バイトまでという厳しい制限があります[5]。ファイル名を適度に短くすると、ダウンロードする際にファイル名を切り詰める必要性が減ります。例えばCDでは、使用する拡張子に応じてファイル名が31、64、197、または207バイト(または文字)に制限されます。また、主題を先頭に配置し、名前が途中で省略されても内容が分かるようにしてください。カテゴリページでは最初の20文字だけが表示されます。地名の場合、追加情報を一切含まない、基本的な名称が最適です。例えば「コロラド州デンバー」や「デンバー市」ではなく、「デンバー」にしてください。
- 省略しないこと – 略語、頭字語、個人のイニシャルは曖昧である場合が多いため、省略せず正式名称で表記すべきです。こうした略語はファイルの主題に関連はしているものの、閲覧者に意味がすぐ伝わるわけではありません。正式名称で表記することで、検索しやすくする効果もあります。簡潔にするために、NATOのような広く認知された頭字語・略語を使用することは、名前の他の部分によって十分に主題を特定できる場合、および画像に書かれている略語を使用する場合にのみ認められます。
- 識別できること – 専門家も、その分野に詳しい一般人も、街中を歩いている無関係な人も含め、なるべく多くの人が名前を理解できる必要があります。
- 直感的であること – 名前は、利用者が対象を探したり検索したりする際に入力する可能性が高いものを予測して付けるべきです。名前に含まれていないが重要であるキーワードは、説明文やメタデータに含めてください。
実用的な考慮事項
- 固有であること – コモンズのソフトウェア設計上、2つ以上のファイルが同じ名前を持つことはできません。衝突を防ぐために、原典、日付、カタログ識別子などの明確に区別できる情報を追加することが推奨されますが、必ずしも必要というわけではありません。
- 適切であること – 名前は(やむを得ない場合を除いて)下品であったり、堅苦しかったりしてはいけません。誹謗中傷・侮辱・下劣・粗雑・攻撃的な表現などの明らかに荒らし・攻撃・挑発するために作成された名前、不適切または非公開の個人情報を含む名前、あからさまな広告や自己宣伝を目的とした名前は、直ちに削除されます。例えば「File:1BIGGest_nOSE_everS33n.JPG」という名前の人物の画像は、残る可能性が低いです。国家主義的、宗教的、人種差別的な運動に関連している、もしくは関連していた名前は、合法的にホストでき、コモンズの範囲内である場合にのみ許可されます。例えば「File:Taiwanese Tiaoyutai Islands map.png」(台湾の釣魚島地図.png)のようなものです。
- 中立的であること – Commons:プロジェクトの守備範囲/中立的な観点を参照。
- 新規アップロード時に特定の言語を使用する義務はありません。たとえ同じ分野の他のファイルが特定の言語を使用していたとしてもです。同じ単語で複数の綴り方がある場合でも、任意の綴りを使用できます。
優先順位を決める基準
- 一般的であること – 主題について様々な名前が考えられる場合は、信頼できる情報源での使用頻度に基づいて、より一般的に使用されている名前を優先してください。名前を決定する際は、検索エンジン、国際機関、報道機関、百科事典、データベース、科学団体、科学雑誌などを参照できます。地名については、現地の言語で最も一般的に使用されている名称を採用してください。
- 一貫していること – 名前は類似したファイル名の命名規則と整合性がとれているべきです。多くの命名規則が存在し、場合によっては基準同士が矛盾することもあるでしょう。現在、標準的な命名規則はありません。特定の命名規則を採用する際は、コストと利点を慎重に比較・検討すべきです。
- 一括アップロードの場合、利用可能なデータに基づいて一貫したファイル名テンプレートを利用します。サンプルテンプレートには
{タイトル} ({原典})、{タイトル} - {原典} {ID}、{簡潔な説明}、{年}が含まれています。 - 全体の一部分を構成するファイル(同じ書籍からのスキャン画像や、コモンズのアップロードサイズ制限により分割された大きな画像など)は、カテゴリや一覧に順番に、かつまとめて表示されるように、同じ規則に従って命名される必要があります。
- 特定の複雑なテンプレート(BSiconsを使用するものやサッカーユニフォームを表示するものなど)は、それらで使用される画像が特定の命名規則に従うことを前提としています。またウィキソースも、転記する元となるファイルが特定の命名規則に従う前提でファイルを使用します。
- 一括アップロードの場合、利用可能なデータに基づいて一貫したファイル名テンプレートを利用します。サンプルテンプレートには
特定の言語でのガイドライン
このガイドラインは英語のファイル名に適用されます。他言語の話者は、関連する翻訳において、その言語のためのガイドラインを定義することができます。
- 推奨される名前のスタイルは、「Smoky sunset in Taiwan」のように、文頭だけ大文字にし句読点は付けない「センテンスケース(ダウンスタイル)」です。この形式は可読性が高く、最大限の情報量が含まれます。一括アップロードなどでは、すべて大文字の表記から文頭だけ大文字にすることが難しいため、タイトルケースなどの他の表記法が有用な場合もあります。
- 冠詞(a、an、the)は、意味を変えずに削除できる場合がよくあります。
- 名前は完全な文章ではなく、小さな情報の断片です。ほとんどの場合、適切な長さは2語から12語です。1語の場合は ほとんどの場合において曖昧すぎるため避けるべきです。20語の場合はおそらく長すぎ、30語以上の場合はほぼ確実に長すぎます。英語のファイル名は、通常1文字あたり1バイトを使用します(一部の記号はASCII文字セットに含まれない場合があります)。そのため、240文字(約50語)が厳密な上限となります。ASCII文字でない場合、1文字あたり最大4バイトを使用するため、240バイトでも240文字より短くなることがあります[6]。
- 名前は時代遅れにならないようにしましょう。「現在(current)」や「現職(incumbent)」、「予定(expected)」、「最近(recently)」、「間もなく(soon)」、「来年(next year)」といった言葉やフレーズは避け、「1969年(in 1969)」や「第5代大統領(fifth president)」といった より正確な表現を推奨します。
- Unicodeの乱用は避けてください。制御文字は省略でき、特殊な句読点は標準的な引用符やカンマに置き換えることができます。また「♥」のような記号は「heart」といった単語で表現した方が自然で、かつ検索時の可視性も向上します。さらに、特定のオペレーティングシステム(OS)やブラウザでは、一部の文字が正しく表示されない場合があります。MediaWikiの制限がない文字や数字、アンダースコア(スペース)、ASCIIハイフンマイナスダッシュ(ASCIIハイフン)、プラス、ピリオド(ドット)のみを使用することが望ましいです。また、発音区別符号やアクセント記号付きの文字も使用可能ですが、省略しても構いません(例えば「Calderón」を「Calderon」に、「Erdoğan」を「Erdogan」に)。
脚注
- ↑ ファイルが外部で使用されている可能性があり、ファイルの移動には相当な人的・機械的リソースが必要となるためです。
- ↑ Commons:既存ファイルへの上書き(ガイドライン)、Template:Dont overwrite
- ↑ Commons:ファイルの改名
- ↑ Commons:Requests for comment/File renaming criterion 2、Commons:ブロックの方針、Commons:プロジェクトの守備範囲#例、Commons:版指定削除も参照
- ↑ 2011年末までは255バイトが上限でした (Phabricator: T32202参照)。既存のファイル名は最大255バイトですが、新規にアップロードする場合は長さが240バイト以下に制限されます。そのため、240バイトを超える名前のファイルは、新しいバージョンのファイルをアップロードする際に大きく破損する可能性があります。これは、古いバージョンのファイル名に接頭辞として日時が追加され、これが15バイトあるからです。
- ↑ Phabricator: T32202