Home -> 雑用 -> 雑用メモ -> [1. ハイフンは"-"だけじゃない、中点は"·"だけじゃない]
2014/10/14 作成
2014/11/01 更新
2016/08/07 更新 (U+02C9, U+05B9, U+05BA, U+05C1, U+05C2, U+05C4, U+05C5,U+06D4, U+06EC, U+0701, U+0702, U+073C, U+073F, U+0740, U+0741, U+0742, U+07F2, U+07FA, U+0830, U+0902, U+093C, U+09BC, U+0A02, U+0A82, U+0B3C, U+0BCD, U+1712, U+1713, U+2027, U+FE52, U+1DA88 を追加)
一切推敲していない糞文章故、大変読み難い代物となっております。
実はphpか何かでモールス信号の変換・逆変換でもしようかと思って調べ物をしていたところ、テーブルの作成で躓きまして、
テーブルの元データはwikipediaからそのまま引っ張って来ようと画策していたのですがこいつが中々の曲者だったという話。
御存じかとは思いますが、モールス信号ってのはトンツーのアレのことです。短点(・)と長点(-)を組み合わせて表記されますよね。
wikipedia日本語版のページには欧文・和文のモールス符号が掲載されています。しかし、このページには一部の対応表が掲載されていないので
その一部を英語版などのページから別途引っ張ってこないといけないことが分かったのですが
ハイフンと中点が日本語版ページでは全角、英語版ページでは半角で記載されているので、エディタ上で全て半角に揃えようと思った訳です。
で、全角を半角に揃えて、よし完成!と思ったのも束の間、確認のために半角ハイフンでファイル内検索すると、半角ハイフンなのに
マーカーで着色されていない(=引っ掛からない)ハイフンがあることに気付く。というのも、ファイル内にこの時点であった「ハイフン」は
の3通りがあり、これらは見た目が(一見すると)同じにもかかわらず、このうち[1.]しか検索に引っかからなかったのである。
で、テキストエディタをよーく見てみると検索に引っかかるやつはそうでないやつに比べて長さがほんの僅かに長い別物であることに気付いた。
ついでに言っておくと、半角中点はエディタだと[1.][2.]ともに全く同じ見た目でも実体は別物という更に厄介な仕様であった。
(これ以外にスペースも複数種あったりするけどその話はまた今度まとめようと思う。)
ソース | ハイフン | 中点 | ||
---|---|---|---|---|
記号 | 参照 | 記号 | 参照 | |
「Morse code」 | − | − |
· | · |
「Morse code for non-Latin alphabets」,キー入力 | - | - |
• | • |
日本語版wikipedia | - | - |
・ | ・ |
あれ、半角ハイフンって2種類もあったのか…と思って調べてみたらハイフン的なものが他にも大量にあるらしいということが判明。
Unicodeはその性格上、似たグリフを持つ文字が大量にあるようだ。
そこで、折角なら今後同じ悩みを抱えることが無いように整理しておこう、と思い立ったのである。
ハイフンとかダッシュとかいろいろごちゃ混ぜ(波ダッシュとか見た目で判別可能なものは除く)。
迷ったらハイフンマイナス使え!という感じらしい。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
- | U+002D |
- - |
ハイフンマイナス Hyphen-minus |
ハイフンでもありマイナスでもありダッシュでもあるという汎用文字。 キー入力したら普通はこれになる。 普段はこれを使う。 |
| U+00AD |
­ ­ ­ |
ソフトハイフン Soft hyphen |
英文で長い単語が折り返すときのアレ。 多分この表では何も表示されないけど行末に来ると横棒が出てくる。 |
˗ | U+02D7 |
˗ ˗ |
MODIFIER LETTER MINUS SIGN | |
̵ | U+0335 |
̵ ̵ |
COMBINING SHORT STROKE OVERLAY | 【̵】 ↑みたいな感じで上に被さる。 |
̶ | U+0336 |
̶ ̶ |
COMBINING LONG STROKE OVERLAY | 【̶】 ↑みたいな感じで上に被さる。 |
۔ | U+06D4 |
۔ ۔ |
Arabic Full Stop | |
ߺ | U+07FA |
ߺ ߺ |
Nko Lajanyalan | |
᠆ | U+1806 |
᠆ ᠆ |
MONGOLIAN TODO SOFT HYPHEN | |
᠊ | U+180A |
᠊ ᠊ |
MONGOLIAN NIRUGU | |
‐ | U+2010 |
‐ ‐ |
ハイフン Hyphen |
タイポグラフィ云々でマイナスでないことを敢えて明示したい時に使う。 例えば「1‐5」で「1の5」を表す。 でも入力がめんどいから普通は使わない。 |
‑ | U+2011 |
‑ ‑ |
ノンブレーキングハイフン Non-breaking hyphen |
行末で折り返しちゃ駄目な時に使う。 |
‒ | U+2012 |
‒ ‒ |
フィギュアダッシュ Figure dash |
ダッシュだけど区間や範囲を表すものと区別したい時に使う。 電話番号の区切りとか。 |
– | U+2013 |
– – – |
エヌダッシュ En dash |
「二分ダッシュ」。区間や範囲を表す時に使う。 例えば「1–5」で「1から5」を表す。 |
— | U+2014 |
— — — |
エムダッシュ Em dash |
「全角ダッシュ」。対で囲んで説明や副題などを表す時に使う。 |
― | U+2015 |
― ― |
ホリゾンタルバー Horizontal bar |
行頭に記述して引用を表す時に使う。 |
⁃ | U+2043 |
⁃ ⁃ |
Hyphen bullet | |
⁻ | U+207B |
⁻ ⁻ |
上付きマイナス SUPERSCRIPT MINUS |
|
₋ | U+208B |
₋ ₋ |
下付きマイナス SUBSCRIPT MINUS |
|
− | U+2212 |
− − − |
負符号 Minus |
タイポグラフィ云々でハイフンでないことを敢えて明示したい時に使う。 例えば「5−1」で「5引く1」を表す。 |
─ | U+2500 |
─ ─ |
横細罫線 BOX DRAWINGS LIGHT HORIZONTAL |
細い「罫線」。 棒グラフのAA作成によく使う。 |
━ | U+2501 |
━ ━ |
横太罫線 BOX DRAWINGS HEAVY HORIZONTAL |
太い「罫線」。 |
➖ | U+2796 |
➖ ➖ |
HEAVY MINUS SIGN | |
⸺ | U+2E3A |
⸺ E3A; |
TWO-EM DASH | |
⸻ | U+2E3B |
⸻ E3B; |
THREE-EM DASH | |
ー | U+30FC |
ー ー |
長音記号 KATAKANA-HIRAGANA PROLONGED SOUND MARK |
「全角長音」。ひらがな・カタカナの伸ばし棒。 |
一 | U+4E00 |
一 一 |
CJK Ideograph, First | 漢数字の「1」。 |
﹣ | U+FE63 |
﹣ ﹣ |
SMALL HYPHEN-MINUS | |
- | U+FF0D |
- - |
ハイフンマイナス(全角) FULLWIDTH HYPHEN-MINUS |
「全角ハイフンマイナス」。 日本語版wikipediaで使われてたやつ。 |
ー | U+FF70 |
ー ー |
長音記号(半角) HALFWIDTH KATAKANA-HIRAGANA PROLONGED SOUND MARK |
「半角長音」。半角カナの伸ばし棒。 |
𝪈 | U+1DA88 |
𝪈 𝪈 |
Signwriting Full Stop |
どう見てもハイフンです。
本当にありがとうございました。
付録的な感じで一応。まずはよく使うやつと紛らわしいやつ。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
_ | U+005F |
_ _ |
LOW LINE 半角アンダーバー |
|
¯ | U+00AF |
¯ ¯ |
MACRON 長音符号 |
|
ˉ | U+02C9 |
ˉ ˉ |
Modifier Letter Macron | |
ˍ | U+02CD |
ˍ ˍ |
MODIFIER LETTER LOW MACRON | |
̄ | U+0304 |
̄ ̄ |
Combining Macron | →̄← ↑みたいな感じで上に被さる。 |
̠ | U+0320 |
̠ ̠ |
COMBINING MINUS SIGN BELOW | → 02D7 ˗ modifier letter minus sign (上の表へ) |
̱ | U+0331 |
̱ ̱ |
COMBINING MACRON BELOW | → 005F _ low line (表内) → 02CD ˍ modifier letter low macron (表内) |
̲ | U+0332 |
̲ ̲ |
COMBINING LOW LINE | = underline, underscore • connects on left and right → 005F _ low line (表内) |
̳ | U+0333 |
̳ ̳ |
COMBINING DOUBLE LOW LINE | = double underline, double underscore • connects on left and right → 0347 ͇ combining equals sign below (表内) → 2017 ‗ double low line |
͇ | U+0347 |
͇ ͇ |
COMBINING EQUALS SIGN BELOW | →͇← ↑みたいな感じで上に被さる。 |
͞ | U+035E |
͞ ͞ |
Combining Double Macron | →͞← ↑みたいな感じで上に被さる。 |
͟ | U+035F |
͟ ͟ |
Combining Double Macron Below | →͟← ↑みたいな感じで上に被さる。 |
ֿ | U+05BF |
ֿ ֿ |
Hebrew Point Rafe | →ֿ← ↑みたいな感じで上に被さる。 |
‗ | U+2017 |
‗ ‗ |
DOUBLE LOW LINE | |
‾ | U+203E |
‾ ‾ |
OVERLINE オーバーライン |
|
⹀ | U+2E40 |
⹀ ⹀ |
ダブルハイフン DOUBLE HYPHEN |
|
_ | U+FF3F |
_ _ |
FULLWIDTH LOW LINE 全角アンダーバー |
|
 ̄ | U+FFE3 |
 ̄  ̄ |
FULLWIDTH MACRON 長音符号 |
|
| U+E002D |
󠀭 󠀭 |
TAG HYPHEN-MINUS |
そして普段は使いそうにないやつ。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
¬ | U+00AC |
¬ ¬ |
NOT SIGN | |
֊ | U+058A |
֊ ֊ |
ARMENIAN HYPHEN | アルメニア語で用いられる…らしい。 |
᐀ | U+1400 |
᐀ ᐀ |
Canadian Syllabics Hyphen | 統合カナダ先住民音節の記号。 |
⁒ | U+2052 |
⁒ ⁒ |
COMMERCIAL MINUS SIGN | |
⁓ | U+2053 |
⁓ ⁓ |
SWUNG DASH | |
⧿ | U+29FF |
⧿ ⧿ |
MINY | |
⨩ | U+2A29 |
⨩ ⨩ |
MINUS SIGN WITH COMMA ABOVE | |
⨪ | U+2A2A |
⨪ ⨪ |
MINUS SIGN WITH DOT BELOW | |
⨫ | U+2A2B |
⨫ ⨫ |
MINUS SIGN WITH FALLING DOTS | |
⨬ | U+2A2C |
⨬ ⨬ |
MINUS SIGN WITH RISING DOTS | |
⸗ | U+2E17 |
⸗ ⸗ |
斜めダブルハイフン DOUBLE OBLIQUE HYPHEN |
|
⸚ | U+2E1A |
⸚ ⸚ |
HYPHEN WITH DIAERESIS | 分音記号付きハイフン。 |
本当は波ダッシュとかチルダとかもあるけど見た目に違いが分かりやすいので省略。
全角ダッシュのマッピング問題とか調べると面白いかもしれないけど省略。
点が真ん中あたりにあるやつ。最早間違い探し。
迷ったら普通の中点使え!って感じらしい。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
· | U+00B7 |
· · · |
中点(ラテン) MIDDLE DOT |
語句の区切りに使う。 |
· | U+0387 |
· · |
ギリシャ語セミコロン GREEK ANO TELEIA |
|
܁ | U+0701 |
܁ ܁ |
Syriac Supralinear Full Stop | |
܂ | U+0702 |
܂ ܂ |
Syriac Sublinear Full Stop | |
ᐧ | U+1427 |
ᐧ ᐧ |
CANADIAN SYLLABICS FINAL MIDDLE DOT | wikipediaに載ってない。 |
ᣟ | U+18DF |
ᣟ ᣟ |
CANADIAN SYLLABICS FINAL RAISED DOT | wikipediaに載ってない。 |
• | U+2022 |
• • • |
ビュレット BULLET |
箇条書きの先頭に打つ点。 |
‧ | U+2027 |
‧ ‧ |
Hyphenation Point | |
∙ | U+2219 |
∙ ∙ |
ビュレット演算子 BULLET OPERATOR |
|
⋅ | U+22C5 |
⋅ ⋅ ⋅ |
ドット演算子 DOT OPERATOR |
|
⸱ | U+2E31 |
⸱ ⸱ |
WORD SEPARATOR MIDDLE DOT | wikipediaに載ってない。 |
⸳ | U+2E33 |
⸳ ⸳ |
RAISED DOT | wikipediaに載ってない。 |
・ | U+30FB |
・ ・ |
中点 KATAKANA MIDDLE DOT |
「全角中点」。 かな入力時に入力すると普通はこれになる。 |
・ | U+FF65 |
・ ・ |
中点(半角) HALFWIDTH KATAKANA MIDDLE DOT |
「半角中点」。 半角カナ入力時に入力すると普通はこれになる。 |
点が上や下に寄ってるやつ。点が2個以上ついてるやつは省略。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
. | U+002E |
. . |
ピリオド FULL STOP |
「半角ピリオド」。 |
˙ | U+02D9 |
˙ ˙ |
DOT ABOVE | |
̇ | U+0307 |
̇ ̇ |
COMBINING DOT ABOVE | →̇← ↑みたいな感じで上に被さる。 |
̣ | U+0323 |
̣ ̣ |
COMBINING DOT BELOW | →̣← ↑みたいな感じで上に被さる。 |
͘ | U+0358 |
͘ ͘ |
COMBINING DOT ABOVE RIGHT | →͘← ↑みたいな感じで上に被さる。 |
֗ | U+0597 |
֗ ֗ |
Hebrew Accent Revia | →֗← ↑みたいな感じで上に被さる。 |
ֹ | U+05B9 |
ֹ ֹ |
Hebrew Point Holam | →ֹ← ↑みたいな感じで上に被さる。 |
ֺ | U+05BA |
ֺ ֺ |
Hebrew Point Holam Haser for Vav | →ֺ← ↑みたいな感じで上に被さる。 |
ּ | U+05BC |
ּ ּ |
Hebrew Point Dagesh or Mapiq | →ּ← ↑みたいな感じで上に被さる。 |
ׁ | U+05C1 |
ׁ ׁ |
Hebrew Point Shin Dot | →ׁ← ↑みたいな感じで上に被さる。 |
ׂ | U+05C2 |
ׂ ׂ |
Hebrew Point Sin Dot | →ׂ← ↑みたいな感じで上に被さる。 |
ׄ | U+05C4 |
ׄ ׄ |
Hebrew Mark Upper Dot | →ׄ← ↑みたいな感じで上に被さる。 |
ׅ | U+05C5 |
ׅ ׅ |
Hebrew Mark Lower Dot | →ׅ← ↑みたいな感じで上に被さる。 |
۬ | U+06EC |
۬ ۬ |
Arabic Rounded High Stop with Filled Centre | →۬← ↑みたいな感じで上に被さる。 |
ܼ | U+073C |
ܼ ܼ |
Syriac Hbasa-Esasa Dotted | →ܼ← ↑みたいな感じで上に被さる。 |
ܿ | U+073F |
ܿ ܿ |
Syriac Rwaha | →ܿ← ↑みたいな感じで上に被さる。 |
݀ | U+0740 |
݀ ݀ |
Syriac Feminine Dot | →݀← ↑みたいな感じで上に被さる。 |
݁ | U+0741 |
݁ ݁ |
Syriac Qushshaya | →݁← ↑みたいな感じで上に被さる。 |
݂ | U+0742 |
݂ ݂ |
Syriac Rukkakha | →݂← ↑みたいな感じで上に被さる。 |
߲ | U+07F2 |
߲ ߲ |
Nko Combining Nasalization Mark | →߲← ↑みたいな感じで上に被さる。 |
࠰ | U+0830 |
࠰ ࠰ |
Samaritan Punctuation Nequdaa | |
ं | U+0902 |
ं ं |
Devanagari Sign Anusvara | →ं← ↑みたいな感じで上に被さる。 |
़ | U+093C |
़ ़ |
Devanagari Sign Nukta | →़← ↑みたいな感じで上に被さる。 |
ॱ | U+0971 |
ॱ ॱ |
DEVANAGARI SIGN HIGH SPACING DOT | |
় | U+09BC |
় ় |
Bengali Sign Nukta | →়← ↑みたいな感じで上に被さる。 |
ਂ | U+0A02 |
ਂ ਂ |
Gurmukhi Sign Bindi | →ਂ← ↑みたいな感じで上に被さる。 |
ં | U+0A82 |
ં ં |
Gujarati Sign Anusvara | →ં← ↑みたいな感じで上に被さる。 |
଼ | U+0B3C |
଼ ଼ |
Oriya Sign Nukta | →଼← ↑みたいな感じで上に被さる。 |
் | U+0BCD |
் ் |
Tamil Sign Virama | →்← ↑みたいな感じで上に被さる。 |
ฺ | U+0E3A |
ฺ ฺ |
Thai Character Phinthu | →ฺ← ↑みたいな感じで上に被さる。 |
ᜒ | U+1712 |
ᜒ ᜒ |
Tagalog Vowel Sign I | |
ᜓ | U+1713 |
ᜓ ᜓ |
Tagalog Vowel Sign U | |
᠂ | U+1802 |
᠂ ᠂ |
MONGOLIAN COMMA | |
․ | U+2024 |
․ ․ |
ONE DOT LEADER | |
⠁ | U+2801 |
⠁ ⠁ |
BRAILLE PATTERN DOTS-1 | 点字。左上だけ点が打たれた状態。 |
⠂ | U+2802 |
⠂ ⠂ |
BRAILLE PATTERN DOTS-2 | 点字。左列の上から2番目だけ点が打たれた状態。 |
⠄ | U+2804 |
⠄ ⠄ |
BRAILLE PATTERN DOTS-3 | 点字。左列の上から3番目だけ点が打たれた状態。 |
⠈ | U+2808 |
⠈ ⠈ |
BRAILLE PATTERN DOTS-4 | 点字。右上だけ点が打たれた状態。 |
⠐ | U+2810 |
⠐ ⠐ |
BRAILLE PATTERN DOTS-5 | 点字。右列の上から2番目だけ点が打たれた状態。 |
⠠ | U+2820 |
⠠ ⠠ |
BRAILLE PATTERN DOTS-6 | 点字。右列の上から3番目だけ点が打たれた状態。 |
⡀ | U+2840 |
⡀ ⡀ |
BRAILLE PATTERN DOTS-7 | 点字。左下だけ点が打たれた状態。 |
⢀ | U+2880 |
⢀ ⢀ |
BRAILLE PATTERN DOTS-8 | 点字。右下だけ点が打たれた状態。 |
〮 | U+302E |
〮 〮 |
HANGUL SINGLE DOT TONE MARK | |
﮲ | U+FBB2 |
﮲ ﮲ |
ARABIC SYMBOL DOT ABOVE | →﮲← ↑みたいな感じで上に被さる。 |
﮳ | U+FBB3 |
﮳ ﮳ |
ARABIC SYMBOL DOT BELOW | →﮳← ↑みたいな感じで上に被さる。 |
﹒ | U+FE52 |
﹒ ﹒ |
SMALL FULL STOP | 旧名「SMALL PERIOD」。 |
. | U+FF0E |
. . |
ピリオド(漢字圏の用途向け) FULLWIDTH FULL STOP |
「全角ピリオド」。 |
で、結局何が言いたいかと言うと、こういうのを気にせずどんどん色んな所からコピペしまくってると実体の異なる文字がいつの間にか
たくさん混ざっちゃうから気を付けましょうねというのと、混ざっちゃったら頑張って統一したほうが良さげだよねというのと、
必要なら適宜使い分けようねということです。
余計なお世話?
いや、雑用メモだからね、これ。
管理人Twitter: @su_te_ak/◆mmft4k9vgtL6
要望等はTwitterへ
Home -> 雑用 -> 雑用メモ -> [1. ハイフンは"-"だけじゃない、中点は"·"だけじゃない]
ここ以降は鯖が勝手に付加するやつです