SEO用語解説 - U
URLの基礎知識
執筆:一般社団法人全日本SEO協会代表理事 鈴木将司
作成:2022年4月3日
インターネットが普及し、SEO(検索エンジン最適化)への関心が高まっている現在。今回は、よりSEOの理解を深めていけるようSEOを成功させるために必要なURLの基礎知識についてわかりやすく解説していきます。
URLとは?
そもそもURLとは何なのでしょうか。URLは、Uniform Resource Locatorの略で、Uniformは「統一された」、Resourceは「資源」、Locatorは「見つけるもの」という意味があるので、直訳すると「全世界統一資源を見つけるもの」になります。
URLは、Web上に存在するWebサイトの場所を示すものでWeb上の住所を意味しているため、Webアドレス、またはホームページアドレスと呼ばれることもあります。
このブログを読んでいる方の中には、実際にテレビを観ていて「番組のホームページアドレスは○○.com です。見てね!」といった言葉を聞いたことのある方もいるのではないでしょうか。
URLの構成はどうなっているの?
それでは次に、WebサイトのWeb上の住所である「URL」の構成や、具体的に何で作られているのかを見ていきたいと思います。
まずは、日本で一番有名とも言えるYahoo!JAPANのURLを見ていきましょう。
Yahoo! JAPAN の URL を見てみると、 https://www.yahoo.co.jp と書いてあります。URLの構成では、まず1番先のhttpやhttpsの部分を「スキーム名」と呼んでいます。スキーム名は、http:や最近だとhttps:が流行っていますが、Yahoo! JAPAN の URLもhttps:を使っていることがわかります。
実際、数年前までは「http」が主流だったものの、最近はほとんどが「https」になりました。
httpsの「s」は何?
それではこのs は何の略なのでしょうか。このsは、secure(セキュア)の略で、secureは「保護された」という意味です。
インターネットをしていると、しばしばセキュリティという言葉を聞くと思いますが、このセキュリティというのは大切なものを保護するという意味で、セキュアのsと同じ意味を持っています。
つまり、httpsのsはデータやファイルの内容が保護されているという意味を表しています。
最近は個人のプライバシーを侵害するハッカーもいるため、企業は情報漏洩を防ごうとプライバシーを守るいろいろな対策をしています。
httpsはそのひとつで、検索ユーザーが入力したキーワードを暗号化してプライバシーを保護しているのです。
どのように保護するの?
それでは、httpsはどのように情報を保護するのでしょうか。実はhttpsにすることで、サイト上で入力された言葉や数字、パスワードなどの個人情報が、ブラウザからサーバーに行くまでのプロセス、あるいは逆のプロセスの際に、全部暗号化されるのです。
例を見ていきましょう。例えば、パスワードが1234だったとします。普通ならこのパスワードは、1234という数字のままの状態でサーバーに行くのです。そのため、外部のハッカーのような人たちは色々な手段でデータを覗き見ることが出来てしまいます。
そこでhttpsでは、その人たちが見ても分からないように1234というパスワードをRTS021など瞬時に他の言葉に置き換えます。要は、暗号化するのです。
そのため、今日ではスキーム名を「https」にすることが主流になりました。これはGoogleでも5~6年ほど前から、公式サイトや海外のマーケティングカンファレンス、SEO の集まりなど様ざまな場所で、ことあるごとに「https にしてください」と言われており、ユーザーを守るために行われています。
自分のWebサイトのスキーム名をhttpsにしよう
ここまでの解説を読んでくださった方の中には、自身のサイトをhttpsにしたいと思われた方もいるのではないでしょうか。
以前は年間○万円と、手痛い金額を支払う必要のあったhttpsですが、最近では「Let’Encrypt」などという無料サービスがあり、手軽に無料で利用できるようになりました。
Let’Encryptで検索すると、「フリーなSSL/TLS証明書-Let’Encrypt」のサイトが出てきます。SSL は時折 TLS とも呼ばれていますが、使用するには証明書が必要です。
この証明書は、さきほども言ったように昔は値段が高く手を出しにくいものがありました。しかし、Googleなどが中心になり、Let’Encryptを無料で配布するようにしたのです。
そのため現在ではSSLを無料で使えるようになっているので、レンタルサーバーを借りるときは、Let’Encryptを活用し、是非積極的にSSLを使ってみてください。
ドメイン名
ここまで、URLを構成する1つ目の要素であるスキーム名について解説してきました。URLを構成する2つ目の要素であるドメイン名については、他のブログ記事で解説しています。
URLでいうwww.aaaaa.co,jp/の部分が「ドメイン名」です。
ディレクトリ名(フォルダー名)
ドメイン名(www.aaaaa.co,jp)の後が、ディレクトリ名もしくはフォルダー名と呼ばれる部分になります。
例に、Let’Encryptのサイトを見てみましょう。
Let’Encryptのサイトの中のよくある質問(FAQ)というページですが、ディレクトリもしくはフォルダー、あるいはサブディレクトリの部分にletsencrypt.org/ja/docs/faqと入っています。
ディレクトリの部分の言い方は、人によって違いますが、基本Web においては同じものだと思ってください。
URLの最後の構成要素がファイル名です。これはディレクトリ名の後に来ます。
file.htmlやfile.phpの部分がそうです。画像の場合だと、photo.jpegやphoto.pngという構造になっています。
また、ファイル名の後ろに書かれているのは、ファイル拡張子名になります。
以上がURLの主な構成です。
URLに関する注意点
ここからは、以上のURLの構成を踏まえた上で、SEOを実務で行う上でのURLに関する注意点を解説していきたいと思います。
.htmと.htmlの違いに注意
これはよくある話なのですが、ファイルを作成する際に.htmと.htmlの2種類を作ってしまう人がいます。
例として、SEO対策セミナーのサイトを挙げてみましょう。
SEO対策セミナーのサイトは、https://www.web-planners.net/がURLです。そしてトップページは、https://www.web-planners.net/index.htmlで、ファイル名は/index.htmlになります。
これを更新しようとして新たなファイルを同じ場所に/index.htmで保存してアップロードしてしまうと、ファイルが上書きされません。そして、/index.htmlと/index.htmの2つが別々に保存されてしまうのです。
このように、lがあるかないかの違いでファイルが別扱いになってしまうので、ウェブサイトを作るときには、.htmで統一するのか、.htmlで統一するのかを予め決めておく必要があります。
そうでないとスタッフ間での共有がうまくいかずに、AさんBさんは.html で保存して、新入りのCさんが知らずに拡張子名だけが.htmで違うものを保存してサーバーにアップしてしまうということがあるのです。
そうした場合、事情を知らないGoogleが「この人たちは 2 つのファイルを別々に作ったのか!それでは別々にインデックスして検索にかけてあげよう」として、両方ともGoogleのデータベースに載ってしまうことになります。
すると、この2つの内容が似ているということで、ペナルティになったり両方のページ、あるいは大切な方のページが検索に掛からなくなってしまうなど、SEOに問題が起こり、順位が落ちてしまう結果に繋がるのです。
そのため、拡張子に関してはぜひ細心の注意を払うようにしてください。
大文字と小文字
また、注意して欲しいのは拡張子名だけではありません。大文字と小文字にも注意する必要があります。
《例》
https://www.yahoo.co.jp/INDEX.HTML
https://www.yahoo.co.jp/index.html
https://www.yahoo.co.jp/Index.html
例えば、index の i を大文字にしたIndex.htmlとしてしまったり、全部をINDEX.HTML としてしまっても、別ファイル名扱いになってしまいます。
私の理解では、Windows以外のUNIX系のmacOSを始め、UNIX をルーツにした世界観だと、ファイル名を決めるときは大文字と小文字は全く別ものと判断されます。
また最近のWindowsを見ていないため現状はわかりませんが、昔のWindowsは大文字と小文字は同じ扱いで、Windowsの世界観だと曖昧だった記憶があります。しかし、UNIXの世界観では別物と判断されるので、ファイル名を決めるときには大文字・小文字の違いにも気を付けてください。
スペースにも注意
《例》
https://www.yahoo.co.jp/INDEX .HTML
https://www.yahoo.co.jp/inde x.html
https://www.yahoo.co.jp/In dex.html
スペースにも注意が必要です。
例えば、Index .htmlのように、スペースが紛れているとまた別のものと思われる可能性があります。場合によってはスペースというのを無視して認識するサーバーもありますが、認識してしまう場合にはトラブルの元になります。
全角にも注意
最後に、日本人は結構やってしまうことがあるのですが、アルファベットを全角にしてしまうことにも気をつけましょう。
《例》
https://www.yahoo.co.jp/INDEX.html
https://www.yahoo.co.jp/INDEX.html
例えば、Dを全角で「D」とやると、別物と思われてしまいます。インターネットの仕様を決めた人たちは、当時UNIXの決め方でやってきたので、UNIX の世界観を尊重して必ず半角小文字にするようにしてください。
全角のやり方も日本やアジアではありますが、トラブルのもとになるので、せっかくあるユニフォームリソースロケーター(Uniform Resource Locator)という全世界統一の規格で、なるべく日本人、アジア人内々だけのアドレスやファイル名ではなく、ヨーロッパやアメリカの人たちにも分かるような、グローバルなやり方に徹して統一してみてください。
まとめ:URLの構造を知り、SEOとの関係について理解を深めよう
URLの構造について解説しながら、SEOとの関係についても触れてきました。
ここまで読んでくださった方には、URLは主に、スキーム名、ドメイン名、ディレクトリ名(フォルダー名、サブディレクトリ名)、ファイル名で構成されていることをわかって頂けたと思います。
また、スキーム名にはぜひhttpsを使って欲しいこと、URLを作成する際にはファイル拡張子名を統一すること、大文字や小文字、スペースや全角にも注意を払って欲しいことなども理解して頂けたのではないでしょうか。
ぜひこれらに気をつけ、全世界共通のグローバルなやり方を身につけてください。