~新人の業務日記その4~

皆様こんにちは、いつまでも新人の心を無くさずにいたい社員sawaです。
このブログが公開される頃にはすっかり梅雨になり、洗濯物が乾かず困っていることでしょうか?それに加えて一番残念なのが、ライフワークのプロ野球観戦でして、雨天中止が増えてきて、チケット取ったのにガックシ…なんてこともよくあります。
雨といえば、業務中、「五月雨式に…」という文をメールで目にしました。
最初は意味が分からず、調べると「物事が一度に終わらず、途切れながら何度か続くこと」と、いう意味らしく、まさに今の季節(旧暦の5月は現在でいう6月:梅雨時期)の雨のように、だらだらと雨が続く様子が由来。日本的で美しい表現だと思いました(生本当の天気が五月雨ばかりだと困りますが…)。
 さて、今月号では、前回のブログとリンクして、現場で役立つ知識編として自分が現場で教わったことを少々取り上げたいと思います。
書籍や職業訓練校では知ることがなかった(目にしていててもスルーしていただけかも…)けれど、知っておいたほうが良いこと、自分が覚えて実際に意識していることをまとめてみました。
このブログを読んでいらっしゃる方やたまたま目にしたエンジニアの先輩方の多くは、「なんだ、そんなことも知らんのか…」と、思うかもわかりませんが、その辺りは未経験新人が富士山登頂を目指す!的なドキュメンタリーの序章と思い、勘弁願います。
 

旋回のブログで文字コードについて少し触れましたが(前回ブログのリンクを貼る)この頃はExcelの表示形式や、ちょっと深く文字コードについて興味が湧いてコソコソと調べております。

【表示形式】

 Excelでは、データの表示形式が標準・数値・通貨…等に分類されています。それぞれデータの用途?に適した形式がありますが、一般的に「数値」「日付」「文字列」あたりは特に使用する頻度の高い形式ではないでしょうか?自身の担当業務ではそれらに加えて「標準」形式を指定することが多いので、その辺りをつまんで調べてみました。
・標準:既定の表示形式であり、入力した通りに表示される。関数の参照元になっているとき、何らかのアプリケーションソフトウェアに取り込むとき等、データの再利用には適していると思います。その辺り、有識者に教わりたいです(笑)。どうなんでしょうか??
実際、通貨や数値形式になっているデータを標準に指定するという作業がけっこうありまして、割と重要な作業工程になっています。「値は再利用できる値にする」と、書籍で目にして納得しました。
・数値:計算や集計に使用される。小数点や区切りや負の数の表示形式まで細かく設定が可能。単位を付けるとコンピュータがデータを数値ではなく文字列として認識することにより、データを再利用(関数を使用するときなど)にデータが反映されず、計算が出来ないことや、ソフトによってはデータを読み込めず作業時にエラーになったり…と、いったことが起きて困ってしまう。
・通貨:業務では金銭(例えば売り上げや取引)のデータを管理することが多いので、この形式にも馴染みがある方も多いのでは??見やすいように3桁ずつ,(カンマ)で区切ったり、小数点以下の計算を指定したりできる。
もう一つ、業務で書式を選択する際に気を付けることとして、赤字について。
小さいころ自営業だったおじいちゃんに教えてもらいました。
「儲かってれば黒い字で書くんだ。で、足りないときは赤い字で書くから赤字なんだ。」みたいな、ザックリした説明だったと記憶しています。
そのとおりで、請求額に対して支払い済の金額が少ない時はマイナス。つまり文字を赤くします。それは今回のテーマであるExcelの表示形式でも同じことですね。負の数を赤い文字にして表示させる機能があります。当たり前といえば当たり前ですね。なにしろ、天国のおじいちゃん、勉強になりました。ありがとう。
・日付:〇月〇日や、〇/〇等、様々な形で日付を表示する。基本的に西暦から入力するというのが掟です・実際、業務では「YYYYMMDD」の形式で入力します。セル内に半角で「6/23」と入力すると、数式バーには「2024/06/23」と表示されます。
これ、表示形式を変えるとなんやら5桁の数字が表示されちゃうわけですが、そもそもこの日付データはシリアル値というもので、1900年1月1日を1日目として、何日目にあたるか?を表している形式だからです。この仕組みのおかげで、例えば締め切りの「〇月〇日まで、あと何日」ということが知りたい場合、関数を使用して残日数や期限等をパッと調べたり出来るわけです。
ちなみに、SQLでデータを抽出する際、うっかり文中の日付をYYYYMMDDの形にせずに日にちだけ入力してDBさんから怒られました。
・文字列:その通り、文字。プログラミングでの文字列とは考え方が異なりますね。実際のところ、作業をしていてあまり仕組みを理解できていないと感じます。
例えば、0落ちや0抜きなんて言ったりしますが、0から始まる値は頭の0が消えたりする。逆に、0埋めといって先頭に‘(アポストロフィー)を付けると文字列として認識され、0が消えずに表示される。もうちょっと理解を深める必要がありますなぁ…。あとは、数式を入力する場合は“(ダブルクォーテーション)で囲むとか(これはプログラミング学習でも触れましたが)、ファイルをCSV形式にして保存する場合にも先頭の0については注意が必要だったりと、なんだかつかめない感じですが、とりあえず、お作法的に、シートの表示形式を予め文字列に指定することは多々あります。

【文字コード】

近い様であまり近くもない話ですが、気になっている文字コードについて。
コンピュータで文字を処理するため、文字に割り当てられた固有の番号(正確には文字のもとになっている数字らしいです)。
欧米などでは英数字と記号を1byte(8bit)で表現できる。一方で、日本のカナ文字や漢字もそうですが、アルファベット以外の文字では2byte(16bit)以上の文字コードが必要になります。2byteで全角の英数字や記号を表現できます。
 頻繁に使うのはShift-JISは日本では代表的な2byteコードの一つといえると思います。
1と1は一般的な人の感じ方からしたら「ちょっと大きさが違う…?」みたいな感じでも、コンピュータからすると「いや、結構大きな違いだからちゃんとどっちなのか指定して…」と、いうところがわかるようでわかりません。
そして、このブログを書いていて「」(鍵括弧)って、半角では表現できないのかと思い調べたところ、いわゆる環境依存文字(機種依存文字)なのですね!いやぁ…調べてみるもんです、意外な発見がありました!
じゃあ、その環境依存文字についても。

【環境依存文字(機種依存文字)】

特定の環境(コンピュータ等の機種)では使用できる文字で、適した環境下でないと文字化けする恐れのある文字。
このような話は今の段階ではあまり役に立たないと思いますが、気になったので掘ってみました。文字コードを言葉で説明できるようになるにはもうちょっと学習が必要ですね…。掘れば掘るほどわけが分からなくなってきます。
すこし逸れますが、気になったのでその他で調べたことについて…

【正規表現】

 最初は文字や数値の表現でのルール的な事かと思いました。
・実はプログラミングの世界では重要。
・文字列を検索する際の考え方で、ザックリと、「この文字列が文の頭にある行を検索したい」「この文字とこの文字の間の文字数は分かってるけど、間の文字が分からない」って感じかな…。と、幼少期から友人で、日本で最難関と呼ばれる国立大学を卒業し、ある超有名電機メーカーに勤務しているプログラマーが教えてくれました!本人にそのまま引用してよいか確認して、承諾を得ています。ギャラとして焼肉をおごります笑。

【体験するということ】

話は変わりますが、先日、友人に誘われてサッカーの観戦に行きました。
国立競技場は建て替え前にコンサートで行って以来、新しくできてからは初めて中に入りました。見違えるほど綺麗になっていました(そりゃ、あれだけのお金かけて作って綺麗じゃなきゃどうしようもありませんが…笑)。お隣の神宮球場には頻繁に行きますが、国立競技場でスポーツを観戦するのは初めてです。
90分、集中して観戦し、とても楽しめました。サッカーはイングランドのプレミアリーグ・マンチェスターシティの試合をチェックするぐらいで、詳しく知りませんが、何でも生で観るのは楽しいです。選手の動きだけでなく、スタジアムについた時の雰囲気やサポーターの応援や試合が動いたときの空気等…IT企業で仕事していてそれを言うな、って感じかもしれませんが、この感覚は、どれだけ技術が発達しても超えることが出来ないのでは?と、スポーツやコンサートを観に行く度に思ったりしています。
今回もとりとめのない感じですが、目を通してくださった方、ありがとうございます。

皆様、暑さにお気を付けて!

ブログ

前の記事

冷めた鉄
ブログ

次の記事

都知事はだあれ?