AnTuTuやPCMarkのベンチマーク結果を参考にするときに、気をつけておきたいこと
スマホの性能を知りたい時、レビューサイトに掲載されたベンチマークスコアを参考にすることは多いですよね。当サイトでもレビュー記事にはいくつかのベンチマークアプリのテスト結果を掲載しています。しかし、様々なサイトで掲載されているベンチマークスコアが、必ずしも公平な条件下で計測されているとは限りません。
たとえば、アプリのバージョンが1つ違うだけでスコアは数十万点単位で跳ね上がることがあります。また、計測時の「室温」や「画面輝度」でも変化します。
そこで今回は、レビューサイトのベンチマーク結果を参考にしたり、自分でテストする際に「ちょっと知っておいたほうが良いこと」をいくつか紹介します。
- 本記事は広告およびアフィリエイトプログラムによる収益を得ています。
AnTuTu Benchmark
スマホのベンチマークとして一番名前の挙がることが多いのが『AnTuTu Benchmark』です。何年も前にGoogle Playストアから削除されたまま復活していませんが、公式サイトからダウンロードして利用できます。
バージョンで数値が大きく異なる
AnTuTu Benchmarkは2026年2月24日時点では11.0.9が最新安定版です。AnTuTuはメジャーバージョン(数字の先頭)が変わるとスコア算出のアルゴリズムが変更され、スコアも大きく変わります。基本的に、バージョンが上がるほど同じ端末でもスコアは高く出る傾向にあります 。
上の画像は同じPixel 9aのテスト結果です。v11.0.8では1,541,748点、v10.5.1では1,228,133点でした。だいぶ変わりますね。
スマホの宣伝文句で「AnTuTu◯◯万点!」と書かれているものがありますが、それはどのバージョンのAnTuTuなのかを確かめたほうがいいです。特にバージョンが切り替わった直後は、以前のバージョンの感覚でいると性能の良さを誤認してしまいがちですので。
室温でもスコアがけっこう変わる
上の画像はどちらも同じ日、同じPixel 9aで同じバージョンのAnTuTu結果です。97万点のほうは室温でテストし、125万点のほうは冷蔵庫内でテストした結果です。テストした日は2025年7月23日、つまり夏です。室温といっても28℃くらい、冷蔵庫内は5℃くらいでしょうか。
スマホは熱によって性能が落ちたり、自動的にパフォーマンスを制限するサーマルスロットリングが機能します。冷蔵庫内では常に冷やされているので熱暴走が起こりにくく常に全力のパフォーマンスです。しかし夏の室温だと熱を持ちやすいのでスコアも落ちてしまいがちです。
冬の暖房の効いてない部屋で冷蔵庫内なら最大のスコアが出るかもしれませんが、普段使いではそこまで性能が出ない(維持できない)こともあるとは頭に入れておいたほうが良いかもしれません。
Android vs iOS の「AnTuTuスコア」は別物
同じAnTuTuでも、Android用とiOS用では測定方法などが異なるため、単純にスコア比較することはできません。「iPhoneはAnTuTu◯◯万点なのにこのAndroidは◯◯万点」と言ってる人はその辺わかってない人、もしくは騙そうとしている人です。
PCMark
PCMark for Android Benchmark
-
制作: UL Benchmarks価格: 無料
PCMarkは総合的なベンチマークアプリで、Web閲覧など基本的な作業に関する性能を測るWork 3.0 performanceや、バッテリーの持続時間を測るWork 3.0 battery lifeがあります。当サイトでも採用しています。
画面輝度やリフレッシュレートで変わる
PCMarkに限らずですが、ベンチマーク結果は画面輝度やリフレッシュレートでも変わります。バッテリーの持続時間を測るテストでは大きく影響するポイントでもあります。
当サイトでは明るさを測定する機器を使って、画面輝度を100-105ルクスに調整してテストしています。リフレッシュレートは表示するものによって最適なものも変わるので、基本的には自動調整(もしくは端末のデフォルト設定)にしています。リフレッシュレートによる差異を出したい場合には60Hzと高リフレッシュレート(144Hzなど)に固定して複数回テストする場合もあります。
レビューサイトによっては、たまに同じPCMarkを使っても「画面輝度を50%に設定してテスト」と書かれている場合があります。これは同じスマホを持っている人が再現できるかもしれませんが、他のスマホとの比較には役立ちません。なぜなら、同じ画面輝度50%でも端末によって明るさは異なるからです。
上の画像の3つのスマホはすべて同じ画面フィルムを貼って、画面輝度を50%に設定したものです。実際の明るさは全然違います。これで比較してはダメでしょう。
その他の注意点
スコアを左右する要素は、他にも細かく存在します。これらが明記されている記事は、より信頼に値すると言えるでしょう。(当サイトがちゃんとしてるとも言えないのが困りものですが…。)
- パフォーマンスモードか否か
端末によっては性能をフルに発揮するパフォーマンスモードや、逆に抑える省エネモードがあります。また、ベンチマークアプリを起動すると自動でパフォーマンスモードになる端末もあります。 - バッテリー残量は十分か
バッテリー残量が少なくなると自動的にパフォーマンスが制限される端末もあります。 - 熱暴走しやすい環境じゃないか
室温でスコアが変わることは先にも書きましたが、ほかにも熱を持つ原因はいくつかあります。充電しながらではバッテリーの発熱もありますし、ケース等を付けてると熱がこもる可能性もあります。
まとめ
ベンチマークスコアは便利な指標ですが、単独の数字だけでは「それが参考になるか、信頼できるのか」わかりません。レビュー記事を読む際は、単にスコアが高い・低いを追うのではなく、比較対象とアプリのバージョンを揃えているか?室温や輝度など、外部要因をコントロールしているか?といった点にも目を向けてみるといいでしょう。
ベンチマークを比較に使う際、完全に統一された環境でテストすることはできませんが、当サイトでは引き続き「できるだけ」公平で誠実な測定をしたいと思ってます。
本記事に記載された内容は記事公開時点のものであり、必ずしも最新の情報とは限りません。記事をご覧いただく際には、最新の情報を確認するようお願いいたします。
OREFOLDER編集長。
1979年静岡県清水市生まれ、現静岡市清水区在住。
様々な巡り合わせから、このサイト1本で生活してる氷河期世代の一人。ガジェットに限らず広く浅く様々なものに興味があります。
スマートフォンは2010年にXperia SO-01Bを買ったのが最初。同時にb-mobile U300で格安SIMも始めました。これまでに数百台のスマホを手にし、格安SIMも常時20種類以上契約しています。



















