「エクセルのセルを結合して何が悪いの? むしろスッキリして見やすいじゃないか」
もしあなたがそう思っているとしたら、残念ながらあなたは知らぬ間に「データの破壊者」になっているかもしれません。あなたが良かれと思って、定規で引いたように美しく整えたその「見栄えの良い表」。それが、システム部門のエンジニアを絶望の淵に突き落とし、数千万円規模のシステム改修を台無しにする「神エクセル」という名のモンスターになっている可能性があるのです。
今回は、総務省も異例のガイドラインを出すほど深刻な「ダメな表」の問題と、初心者でも今日から実践できるデータの整理術「第一正規化」について、ゆるく、かつ論理的に、そして少しの毒を込めて解説します。
エンジニアとの不要な摩擦をゼロにし、あなたのExcelを「ただの絵」から「最強の資産」へ変えるための指針をお届けします。
セル結合は「データの殺人」?エンジニアが発狂する理由
エクセルやGoogleスプレッドシートにある「セルの結合」機能。表の見出しを整えるために、私たちは当たり前のようにこのボタンを押します。しかし、エンジニアの視点から見れば、この操作は「情報の暗殺」に他なりません。
「エンジニアは非エンジニアが作ったエクセルスプレッドシートを渡されて発狂するっていうことが、非常にしばしばありました。」
なぜそこまで嫌われるのか。それは、コンピュータにとって表とは「縦と横の座標」で管理されるものだからです。セルが結合された瞬間、その座標系はグチャグチャに崩れます。
例えば、結合された表をCSV形式で書き出し、AIやプログラムに読み込ませようとするとどうなるか。あるはずの場所にデータがなく、予期せぬ場所からゴミのような文字が飛び出してくる。プログラムはエラーを吐き出し、システムは止まります。「もうセルを結合っていうボタン、ちぎって捨てたほうがいい。手突っ込んで握りつぶしたい(笑)」というエンジニアの叫びは、決して大げさな表現ではないのです。
見た目を綺麗にするという人間都合の「優しさ」が、コンピュータにとっての利便性を完全に破壊してしまう。このギャップこそが、現場でエンジニアたちが「神エクセル(見た目だけは神々しいが、中身は使い物にならないエクセル)」を忌み嫌う理由なのです。
国も認めた「ダメな表」の正体。なぜ377億円(令和2年度)と書くと、Excelは死ぬのか?
実はこの問題、現場のエンジニアのわがままではありません。国(総務省)も、行政文書などのデータが「機械で読み取りにくい(機械判読性がない)」ことに危機感を抱き、公式に改善ガイドラインを出すほどの国家レベルの課題となっています。
ガイドラインで「ダメな例」として真っ先に挙げられているのが、1つのセルの中に「377億円(令和2年度)」のように、数値と注釈を混ぜて書いてしまうパターンです。
「これ、表である意味が全くないんですよ。ただの自然言語による記述なんです。」
これをやってしまうと、Excelは「377」という数値を数値として認識できず、ただの「文字」として扱います。すると、合計(SUM)や平均(AVERAGE)を出そうとしてもエラーになるか、ゼロとしてカウントされてしまいます。
こうなると、結局は人間が1つずつセルを覗き込み、手作業で数値を打ち直すしかありません。これでは、どんなに高性能なコンピュータを使っていても、やっていることは「そろばん」の時代と変わりません。エンジニアに言わせれば、これは「非正規リレーション」のカオス。表という体裁を借りただけの「メモ書き」であり、再利用性を自ら捨てているに等しい行為なのです。
脱・初心者!「第一正規化」で論理的に正しい表を作る
では、エンジニアに愛され、自分自身の仕事も楽にするためにはどうすればいいのか。その答えが、データベースの世界の基礎教養である「正規化」です。
その第一段階である「第一正規化」のルールは、驚くほどシンプルです。
「1つのセルには、1つの値(情報)だけを入れる」。これだけです。
具体的には、以下の3つのポイントを今日から意識してください。
- カッコ書きを辞める
「高評価数(率)」のように、1つの列に2つの意味を持たせないでください。「高評価数」列と「高評価率」列に、潔く分割しましょう。 - 表の中に表を作らない
「部署名」のセルの下に「課名」や「氏名」をぶら下げるような、階層構造の結合セルは卒業です。1行につき「どの部署の、どの課の、誰か」がすべて独立して書かれている状態を目指してください。 - 単位はセルに入れない
「円」や「個」はセルの外(列の見出し)に追い出してください。セルの中身は、純粋な数値だけにします。
このように情報を最小単位まで分割することを「第一正規化」と呼びます。この「数学的な不自由」を受け入れた瞬間に、あなたのデータは初めてコンピュータという最強のパートナーと対話可能な「資産」へと変わるのです。
コピペの裏に潜む「上長性」という名の時限爆弾
第一正規化をクリアしても、まだ油断はできません。次に待っているのは「コピペ」という魔の誘惑です。
例えば、社員名簿を作る際、部署名を書くたびにその隣に「部長名」をコピペして入力していませんか?
「コピペはあまりにも便利だから、みんな手当たり次第に使っている。でも、実はコピペにはリテラシーがあるんです。」
部長が交代した際、1000箇所ある部署データの横にある部長名をすべて手作業で書き直す……。そんな絶望的な作業に直面したことはありませんか? これは「関数従属性」と呼ばれる問題で、データの重複(上長性)がメンテナンスコストを爆発させている状態です。
「ここが決まれば、あそこも決まる」という重複した情報は、本来、別の表に切り出して管理すべきものです。これを怠ると、未来の自分が「置換作業の嵐」という名の地獄に巻き込まれることになります。コピペは麻薬です。その場は一瞬で終わりますが、修正が必要になった瞬間に、あなたを確実に蝕みます。
まとめ
この記事をまとめると…
- セル結合は厳禁: 見た目の綺麗さよりも、コンピュータが読み取れる構造(機械判読性)を優先すべき。
- 1セル1情報が鉄則: 単位や注釈をセル内に混ぜる行為は、計算機能を麻痺させ、データを「死」に至らしめる。
- 第一正規化の極意: 情報を最小単位まで分割し、座標(行と列)の関係を正しく保つことが、データ整理の出発点である。
- コピペの罠: 重複したデータを安易に増やす運用は、将来の修正コストを爆発させる負債となる。
正直なところ、セル結合ボタンを押さない、1セルずつ律儀に情報を分けるという作業は、最初は面倒に感じるかもしれません。しかし、その「少しの不自由」が、一ヶ月後のあなたを、そして共に働くエンジニアを救います。
「綺麗にラッピングされた雑巾」のようなデータはもう卒業しましょう。今日からあなたのマウスは、セル結合ボタンを避けて通るはずです。
配信元
番組名:ゆるコンピュータ科学ラジオ
タイトル:技術者に怒られないためのエクセル術。セルを結合するな。【データベース3】#89
配信日:2023-09-10


