Home -> 雑用 -> 雑用メモ -> [2. スペースは" "だけじゃない的な話]
2014/10/15 作成
2014/10/20 更新
2014/11/01 更新
一切推敲していない糞文章故、大変読み難い代物となっております。
[1. ハイフンは"-"だけじゃない、中点は"·"だけじゃない]の整理中にふとテキストエディタを見た時に、半角スペースなのに
記号表示がされていないものがあることに気付いた。というのも、エディタの設定で半角スペースの位置に薄く空白記号が描画される
ようにしているのだけれども、一部のスペース(一見普通の半角っぽい)ではそれが描画されていなかったので違和感全開だったのである。
で、調べてみたら記号表示されていない方は
(= 
)であることが分かった。
の存在自体はずっと前から知っていたのだけれども、これはHTML独自の仕様だとばかりずっと思っていたので、
いわゆる半角スペース( 
)とは別に
にコードポイントが割り当てられていることを知って少し面食らった。
いろいろあるけどHTML上では見えたり見えなかったり。両脇に文字がないと空白ができない、なんてこともある。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
U+0009 |
	 	 |
水平タブ (HT) CHARACTER TABULATION |
[ ]←ここに入ってる空白がそれ。 タブ。↑のHTML上からコピーしても U+0020 になる。 |
|
U+000A |

 |
改行 (LF) LINE FEED |
一応 | |
U+000B |
  |
垂直タブ (VT) VERTICAL TABULATION |
一応 | |
U+000C |
  |
フォームフィード (FF) FORM FEED |
一応 | |
U+000D |

 |
復帰キャリッジ・リターン (CR) CARRIAGE RETURN |
一応 | |
U+001C |
  |
FILE SEPARATOR | 一応 | |
U+001D |
  |
GROUP SEPARATOR | 一応 | |
U+001E |
  |
RECORD SEPARATOR | 一応 | |
U+001F |
  |
UNIT SEPARATOR | 一応 | |
U+0020 |
    |
スペース SPACE |
[ ]←ここに入ってる空白がそれ。 「半角スペース」。普通にキー入力するとこれになる。 |
|
U+00A0 |
    |
ノーブレークスペース NO-BREAK SPACE |
スペース箇所での改行を避けたい時に使う。 見た目にはU+0020とほぼ同じだけど別物。 |
|
ᆣ | U+11A3 |
ᆣ ᆣ |
HANGUL JUNGSEONG A-EU | |
ᆤ | U+11A4 |
ᆤ ᆤ |
HANGUL JUNGSEONG YA-U | |
ᆥ | U+11A5 |
ᆥ ᆥ |
HANGUL JUNGSEONG YEO-YA | |
ᆦ | U+11A6 |
ᆦ ᆦ |
HANGUL JUNGSEONG O-YA | |
ᆧ | U+11A7 |
ᆧ ᆧ |
HANGUL JUNGSEONG O-YAE | |
U+1680 |
    |
OGHAM SPACE MARK | [ ]←ここに入ってる空白がそれ。 ↑のHTML上からコピーしても U+0020 になる。オガム文字?ナニソレ |
|
| U+180E |
᠎ ´E; |
MONGOLIAN VOWEL SEPARATOR | []←ここに入ってる空白がそれ。 ↑のHTML上からコピーしても U+0020 になる。モンゴル語?ナニソレ |
U+2000 |
    |
EN QUAD | n幅の四角形。 | |
U+2001 |
    |
EM QUAD | m幅の四角形。 | |
U+2002 |
      |
EN SPACE | n字幅の空白(半角空白)。 半角とは言ってもU+0020とは別物。 |
|
U+2003 |
      |
EM SPACE | m字幅の空白(全角空白)。 全角とは言ってもU+3000とは別物。 |
|
U+2004 |
    |
THREE-PER-EM SPACE | (1/3)m幅の空白。 | |
U+2005 |
    |
FOUR-PER-EM SPACE | (1/4)m幅の空白。 | |
U+2006 |
    |
SIX-PER-EM SPACE | (1/6)m幅の空白。 | |
U+2007 |
    |
FIGURE SPACE | 数字用空白。 | |
U+2008 |
    |
PUNCTUATION SPACE | 句読点用空白。 | |
U+2009 |
      |
THIN SPACE | 狭い空白。 | |
U+200A |
    |
HAIR SPACE | 非常に狭い空白。 | |
| U+200B |
​ ​ |
ゼロ幅空白 ZERO WIDTH SPACE |
|
U+202F |
    |
NARROW NO-BREAK SPACE | 幅の狭いノーブレークスペース。 | |
U+205F |
    |
MEDIUM MATHEMATICAL SPACE | [ ]←ここに入ってる空白がそれ。 中くらいの大きさの数学用空白。 |
|
| U+2060 |
⁠ ⁠ |
ワード接合子 WORD JOINER |
U+FEFFの代替。 |
U+3000 |
    |
和字間隔 IDEOGRAPHIC SPACE |
「全角スペース」。 かな入力時にスペースを入力するとこれになる。 |
|
ㅤ | U+3164 |
ㅤ ㅤ |
HANGUL FILLER | |
| U+FEFF |
  |
ゼロ幅のノーブレークスペース ZERO WIDTH NO-BREAK SPACE |
UTF-8のBOMと同じせいで何となくアレルギー反応がある。 |
さっき「ゼロ幅空白」なるものが出てきたけれども、こんな感じで幅を持たない文字ってのもいくつかあるので整理。 上の表と2つほど重複するけどまあ気にせず。
記号 | Unicode | 参照 | 名称 | 備考 |
---|---|---|---|---|
͏ | U+034F |
͏ ͏ |
結合書記素接合子 COMBINING GRAPHEME JOINER |
【͏】 |
| U+200B |
​ ​ |
ゼロ幅空白 ZERO WIDTH SPACE |
【】 |
| U+200C |
‌ ‌ ‌ |
ゼロ幅非接合子 ZERO WIDTH NON-JOINER |
【】 筆記体を表示するときに文字をくっつけないための制御記号。 ニコニコ動画でNG避けコメントするのに使われてる。 |
| U+200D |
‍ ‍ ‍ |
ゼロ幅接合子 ZERO WIDTH JOINER |
【】 筆記体を表示するときに文字をくっつけるための制御記号。 |
| U+200E |
‎ ‎ ‎ |
記述方向制御(左から右へ) LEFT-TO-RIGHT MARK |
【】 LRM。 |
| U+200F |
‏ ‏ ‏ |
記述方向制御(右から左へ) RIGHT-TO-LEFT MARK |
【】 RLM。 |
U+2028 |

 
 |
行区切り文字 LINE SEPARATOR |
【 】 | |
U+2029 |

 
 |
段落区切り文字 PARAGRAPH SEPARATOR |
【 】 | |
| U+202A |
‪ ‪ |
LRE LEFT-TO-RIGHT EMBEDDING |
【】 |
| U+202B |
‫ ‫ |
RLE RIGHT-TO-LEFT EMBEDDING |
【】 ↑の2つ目の括弧はHTMLソース上では普通の閉じ括弧です。 ‫より後ろの文は右読みになります。 |
| U+202C |
‬ ‬ |
PDF POP DIRECTIONAL FORMATTING |
【】 RLEやRLO等による文字方向に関する指示を元に戻す |
| U+202D |
‭ ‭ |
LRO LEFT-TO-RIGHT OVERRIDE |
【】 |
| U+202E |
‮ ‮ |
RLO RIGHT-TO-LEFT OVERRIDE |
【】 ↑の2つ目の括弧はHTMLソース上では普通の閉じ括弧です。 ‮より後ろの文は右読みになります。 |
| U+2061 |
⁡ ⁡ |
関数適用 FUNCTION APPLICATION |
【】 |
| U+2062 |
⁢ ⁢ |
不可視の乗算記号 INVISIBLE TIMES |
【】 |
| U+2063 |
⁣ ⁣ |
不可視の区切り文字 INVISIBLE SEPARATOR |
【】 |
| U+FEFF |
  |
ゼロ幅のノーブレークスペース ZERO WIDTH NO-BREAK SPACE |
【】 UTF-8のBOMと同じせいで何となくアレルギー反応がある。 |
管理人Twitter: @su_te_ak/◆mmft4k9vgtL6
要望等はTwitterへ
Home -> 雑用 -> 雑用メモ -> [2. スペースは" "だけじゃない的な話]
ここ以降は鯖が勝手に付加するやつです