Webアプリのセキュリティ初心者がまず学ぶべき勘所！セキュリティ勉強会を主催して見つけた3つのポイント

執筆者

更新日：2022.12.23

Webアプリのセキュリティ初心者がまず学ぶべき勘所！セキュリティ勉強会を主催して見つけた3つのポイント

目次

はじめに
勘所、の前に
テキストで学んだセキュリティ知識をテストでチェック
勘所をご紹介！
1. HTTP
2. セッション/cookie
攻撃手法の区別
まとめ

はじめに

他者とのコミュニケーション、買い物、エンターテイメント、日々の生活はインターネットなしには考えられないものとなりました。その反面、個人情報の流出やフィッシング詐欺などのWebサイトのセキュリティに関する事件・事故が多発しています。Webサービスの開発業務を日々行っているPLAN-Bのエンジニアもこのような事件・事故と無縁ではいられません。このためPLAN-Bでは全エンジニアを対象にWebセキュリティ知識のテストを行っています。

私もこのテストに合格するために勉強し、またセキュリティ勉強会を主催して全員がセキュリティテストに合格するよう活動してきました。その中で、Webセキュリティを学び始めた人が

学習を進める上でおさえるべきこと
学んでおくことで学習がスムーズになること

というところがわかってきました。

今回はテスト対策を行う中で考えに至った「Webセキュリティ初心者が学ぶべき勘所」を紹介したいと思います。Webサイトのセキュリティを学び始めたエンジニアの方や、社内エンジニアのセキュリティスキルを強化したい方は参考にしてみてください。

勘所、の前に

勘所を紹介する前に、PLAN-BではどのようにWebサイトのセキュリティを学習しているかを紹介します。
共通の学習用テキストを決めた
めいめいが闇雲にセキュリティ知識を学んでも開発チーム内で知識レベルに差が出てしまったり、網羅的な知識習得が難しくなります。
このため、PLAN-Bでは学習用テキストおよびテストの出題範囲としてIPAが発行している「安全なウェブサイトの作り方」改定第七版を利用し、知識の均一化を図っています。

テキストで学んだセキュリティ知識をテストでチェック

テキストを読むだけでは学習したことが身についたのか確認が行えません。このためPLAN-Bでは学習内容をチェックするため、セキュリティテストを実施しています。

例えば、次のような問題です。

●問題：XSSの対策について、「HTMLテキストの入力を許可しない場合の対策」および、「全てのウェブアプリケーションに共通の対策」の中で根本的解決として正しいものを選べ。(複数回答可)

A：入力されたHTMLテキストから、スクリプトに該当する文字列を排除する。
B：入力値の内容をチェックする。
C：クロスサイト・スクリプティングの潜在的な脆弱性対策として有効なブラウザの機能を有効にするレスポンスヘッダを返す。
D：URLを出力するときは、「http://」や「https://」で始まるURLのみ許可する。
E：ウェブページに出力する全ての要素に対して、エスケープ処理を施す。

答：D, E

テキスト持ち込みなし。部分点なし。過不足なく選択肢を選べていなければ正解となりません。テスト合格のボーダーラインも80%以上の正答率であること、と高めに設定しています。

エンジニア全員がこの難易度の問題に正答できる知識を備えているならば、テキストで語られる脆弱性を誤って作り込むことは無いですし、他エンジニアも同一内容の知識を勉強をしているので設計レビューやコードレビューで指摘がなされます。出題者の求めるレベルはなかなか高いですが、エンジニア全員にセキュリティ知識のベースができあがります。

勘所をご紹介！

「安全なウェブサイトの作り方」という名前の学習用テキストにしている以上、テキストを読み進めるにはWebで使用される技術知識を知っていることが求められます。逆説的にWebで使われる技術知識の不足が初心者の理解を妨げる要因です。
ご紹介する勘所は以下3点です。

HTTP
セッション/cookie
攻撃手法の区別

HTTP

兎にも角にもHTTPの仕組みをおさえましょう。でなけれなWebセキュリティに対する正確な理解が困難です。

といっても、なにやら複雑な処理や手順を行っているわけではなく、HTTPという決まった手順でWebサーバと情報をやり取りしています。そして、やり取りしている情報は決して人間が読めないような代物ではありません。

例えばPLAN-BのコーポレートサイトのTOPページ https://www.plan-b.co.jp/ を表示する場合、以下のようなテキストを送信しています。

GET / HTTP/1.1
Host: www.plan-b.co.jp

このテキストは「www.plan-b.co.jpというホスト名の / が表す場所にあるリソースがほしいです、GETしたいです。」という命令を表しています。

対してWebサーバからは以下のような返答を返しています。

HTTP/1.1 200 OK
Date: Sat, 09 Mar 2019 14:40:23 GMT
~~~ (割愛) ~~~
Connection: close
Transfer-Encoding: chunked
Content-Type: text/html; charset=UTF-8

<!doctype html>
<html>
~~~ (以下、コーポレートサイトTOPページのhtmlテキストが続く) ~~~

一行目で「OK」といっていますね。Webサーバは「リソースをGETしたいです」と言っていた送信者に対して求められていた場所にあるHTMLソースを送ってくれたようです。

送ってもらったHTMLをブラウザが読み取ることでブラウザにWebページの画面が表示されます。
検索サイトを利用して調べ物したり、ECサイトで買い物をするなどインターネットで行われる通信の多くは、例のような送信者とWebサーバがひたすらテキストベースの命令とその返答をやりとりすることで行われています。

セッション/cookie

初学者が意外と見落としがちなのが、セッションとcookieではないでしょうか。

「名前は聞いたことあるけど、何をやっているのおぼろげにしかわからない…。」
テキストを読み進んでもセッション/cookieの理解がおぼろげでは、テキストの内容が腑に落ちず理解が進みにくいですよ。

この点については、セッション/cookieがなぜ生まれたのかを知ることが大切です。

前節で解説したHTTPにはユーザの状態を記憶/管理する仕組みはありません。なぜならWebの仕組みは論文などの研究成果をリンクさせて情報検索を容易にするために生まれたものだからです。
論文を読んでもらうという目的ために、論文閲覧者の操作状況などの状態をWebサーバが知っておく必要は無いはずです。Wikipediaを閲覧するだけのために、あなたはログインを行いますか？

しかし、

SNSで近況を投稿するとき、あなたはSNSサイトにログインしますよね？
ECサイトで買い物をする場合、あなたはカートに商品をいれますし、別の商品を探してる最中に突然カートに入れた商品が消える、なんてことないですよね？

などなど、現在のWebではWebサーバ側でユーザのログイン有無や、ユーザの操作を覚えておくこと、ひっくるめてユーザの状態を覚えて管理する機会が非常に多いです。ユーザの状態を管理する仕組みがHTTPでSNSやECサイトのカート機能を実現しているのがセッション/cookieです。

ユーザがWebサイトを回遊している一連のやり取りをセッションと呼び、Webサーバはユーザごとに1つのセッションを識別するID、セッションIDを割り当てます。
ECサイトならログイン有無やカートの中身はWebサイトがセッション中のやり取りとして覚えています。
しかし、Webサイトは不特定多数の人が利用します。ユーザごとに一意なセッションIDが割り当てられていますが、誰がどのセッションIDに対応するユーザなのか名乗り出てもらわないとわかりません。つまり、ユーザが「私はこのセッションIDでWebサーバとやり取りをしています」と言ってもらわないとWebサーバはユーザを区別できません。

ここでcookieの出番です。cookieはWebサイトで利用される情報をユーザのWebブラウザに保存したものです。cookieはWebサイト毎にブラウザに保存され、セッションIDはこのcookieの中に保存されます。
そしてユーザがWebサイトにアクセスするときcookieに保存されている情報も一緒にWebサイトにわたします。つまり、Webサイトはユーザから「私はこのセッションIDだよ」と教えてもらっています。こうすることでWebサイトはユーザを区別することができます。