Apple の VisionOS がコンピュータ インターフェイスで大胆な飛躍を遂げる
スティーブン・レヴィ
今週、カリフォルニア州クパチーノで開催された Worldwide Developers Conference で発表された Apple の新しい Vision Pro をテストすることができた他の皆さんと同じように、私もそれを体験するのが待ちきれませんでした。 しかし、臨時テスト施設の Apple 技術者が光学装置を使用して私の処方レンズをチェックしたとき、問題があるかもしれないと気づきました。 私の眼鏡のレンズには、二重に見える症状に対処するためのプリズムが付いています。 Apple はメガネをかけている私たちのほとんどに対応できるよう、あらかじめ研磨された Zeiss レンズのセットを用意していますが、私の問題を解決できるものはありませんでした。 (Vision Pro の発売まであと 1 年ほどあるので、このベータ版ですべての処方箋を処理できるとは予想していませんでした。何年も運用してきたにもかかわらず、Warby Parker は依然として私のレンズを研磨できません。) いずれにせよ、 、私の懸念は的中しました。デモルームに着くと、デバイスの重要な機能である視線追跡のセットアップが機能しませんでした。 私が体験できたのはデモの一部のみ。
私が実際に見たものは、これが世界で最も先進的な消費者向け AR/VR デバイスであることを確信させるのに十分でした。私は、私が座っていた人工的にレンダリングされた部屋に浮かぶ仮想オブジェクトとアイコン、そしてその代替デバイスの両方の忠実さに目がくらみました。没入モードで配信される現実には、傍観者にされたスポーツ イベント、心地よい花びらの形に包まれた 3D マインドフルネス ドーム、そしてこれまでサンプルした中で最高の VR に匹敵する胃が痛くなるような山頂への小旅行などが含まれます。 (完全なデモに関する Lauren Goode の説明を読むことができます。)
残念ながら、私の視線追跡の問題により、Vision Pro の最も重要な部分、つまり Apple のコンピュータ インターフェイスにおける最新の飛躍をサンプルすることができませんでした。 マウス、キーボード、またはタッチセンサー式ディスプレイ画面を使用せずに、Vision Pro を使用すると、2 つの高解像度マイクロ OLED ディスプレイに送信された画像を見て、タップなどの指のジェスチャーを行うだけでメニュー項目を選択したり、スクロールしたり、そして人工物を操作します。 (他のコントロールはデジタル クラウンと呼ばれるノブと電源ボタンのみです。) Apple はこれを「空間コンピューティング」と表現していますが、ネイキッド コンピューティングと呼ぶこともできます。 あるいは、その名称は、約 1 ポンドのスキューバ スタイルのフェイスマスクが将来のバージョンでスーパーチャージ眼鏡に置き換えられるまで待たなければならないかもしれません。 テストした人は、ほぼ瞬時にツールを使いこなすことができ、ドキュメントを呼び出したり、Safari を閲覧したり、写真を取得したりすることが簡単にできたと述べています。
VisionOS は、その名の通り、コンピューティング本来のインターフェイスという牢獄、つまり、キーボードで英数字のストリームを呼び出すまで何も起こらない、扱いにくく柔軟性に欠けるコマンド ラインや、その他すべての機能から抜け出す半世紀の旅における重要な一歩です。その後、同様に制限的なキーボードの回避策が発生しました。 1960年代に入り、スタンフォード研究所のダグ・エンゲルバートを皮切りに、研究者らがコマンドラインへの攻撃を主導した。同氏のネットワーク化された「拡張コンピューティング」システムでは、カーソルを動かしたり、メニュー選択でオプションを選択したりするためのマウスと呼ばれる外部デバイスが導入された。 その後、ゼロックス PARC の科学者は、これらのアイデアの一部を応用して、グラフィカル ユーザー インターフェイス (GUI) と呼ばれるものを作成しました。 PARC で最も有名なイノベーターであるアラン ケイは、ポータブルで直観的なコンピューティングの一種の聖杯である、Dynabook と呼ばれる理想的なコンピューターの計画を立てました。 1979 年の研究室訪問で PARC の技術革新を見た後、Apple のエンジニアは、最初に Lisa コンピュータ、次に Macintosh で GUI を大衆市場に導入しました。 最近では、Apple が iPhone のマルチタッチ インターフェイスのパラダイムを提供しました。 これらのピンチやスワイプは、私たちがポケットや手首に入れて持ち歩く、小さくても強力な携帯電話や時計のデジタル機能にアクセスする直感的な方法でした。
これらのコンピューティングの各シフトの使命は、強力なデジタル世界と対話するための障壁を低くし、コンピューターが提供する機能を利用することの困難さを軽減することでした。 これには代償が伴いました。 設計上直感的であることに加えて、コンピューターを使用していないときに使用する自然なジェスチャーは無料です。 しかし、コンピュータを自然界と同じくらい使いやすく、鮮やかにするには、費用がかかります。 コマンド ラインからビットマップ表示に移行すると、英数字をさまざまなフォントで表現したり、ドキュメントをファイル フォルダーにドラッグしたりできるようになり、さらに多くの計算が必要になりました。 コンピューターが物理世界を模倣し、実際の現実をナビゲートするために使用するジェスチャーを受け入れれば受け入れるほど、より多くの作業と革新が必要になります。
Vision Pro はそれを極限まで高めます。 少なくともこの最初のバージョンでは 3,500 ドルかかるのはそのためです。 (Vision Pro は Apple の 1983 年製 Lisa の 2023 年バージョンであるという議論があります。この Lisa は 10,000 ドル以上のコンピュータで、最初にビットマッピングとグラフィカル インターフェイスを消費者向けデバイスにもたらし、その後 Macintosh の邪魔にならなくなったものです。そのフェイスマスクの内側に、Apple は最も強力なマイクロプロセッサの 1 つを詰め込んでいます。 デバイス用に特別に設計された別のカスタムシリコン。 それぞれの目に4Kプラスディスプレイ。 LIDAR スキャナーを含む 12 台のカメラ。 頭と目の追跡、3D マッピング、手のジェスチャーのプレビュー用の一連のセンサー。 デュアルドライバーオーディオポッド。 ヘッドバンドにはエキゾチックなテキスタイル。 そして現実の光の侵入を防ぐ特殊なシール。
ジェレミー・ホワイト
ケイト・ニブス
ジェレミー・ホワイト
WIREDスタッフ
ハードウェア、ソフトウェア、そして 5,000 を超える特許から得た恩恵をすべて備えた Vision Pro、そして暗黙のうちにその後継者は、私たちを自然なコンピューティングの頂点への登頂へと導いてくれると考えています。 しかし、デモ中に、野球の試合、レコーディング スタジオ、いくつかの山の間の綱渡りなどのリアルな 3D 描写に夢中になっていなかったとき、このステップが私たちを未知の領域に連れて行っていると感じました。 これまでのインターフェースの飛躍はすべて、私たちがデジタル世界の内部に到達してその力を活用できるようにするために向けられたものでした。 Macintosh でフォルダを選択するとき、あなたはコンピューティングのスープに手を入れていることになります。 しかし、Vision Pro は私たちをデジタル世界の中に置き、私たちの感覚を物理的領域から切り離します。 アプリを使用していないモードでも、Vision Pro のカメラとディスプレイは、ユーザーが座っている実際の部屋をレンダリングするために一生懸命働いています。それは本物のように見えますが、その現実は空間に浮かぶアプリのアイコンと同じくらい儚いものです。 、目でどれかを選択するまで待ちます。 このことから、自然なインターフェイスを押し出しすぎたのではないかという疑問が生じます。人々は仕事やその他のデジタル タスクを行うために現実世界を離れたいと思っているのでしょうか? 質問はオープンです。
結局のところ、この領域はある程度図示されていますが、Apple は実際に私たちをそこに連れて行く上で他のどの企業よりも遠くまで進んでいます。 今週私との電子メールのやりとりの中で、アラン・ケイは、1970年代初頭にDynabookの複数の形式を想像して作成したスライドについて語った。 1972 年のスケッチには、Dynabook の最新のタブレット版だけでなく、メガネの中にポケットサイズのマシンが入っており、目に見えない画面を制御する手のジェスチャーも描かれていました。 そして手には Apple Watch のようなものを付けています。
ケイ氏は、このスケッチにはコンピューターの先駆者であるアイヴァン・サザーランド氏とニコラス・ネグロポンテ氏のアイデアを参考にしたと語った。 彼はまた、サザーランドが 1962 年に書いたさらに突飛な論文を私に教えてくれました。 「究極のディスプレイは、もちろん、コンピューターが物質の存在を制御できる部屋になるだろう」と、ティム・クックが2歳になった年にサザーランドは書いた。 「そのような部屋に展示されている椅子は座るのに十分でしょう。そのような部屋に展示されている手錠は窮屈であり、そのような部屋に展示されている銃弾は致命的です。適切なプログラミングがあれば、そのような展示は文字通りワンダーランドになる可能性があります」アリスが歩いたところです。」 Apple は確かにワンダーランドを創造したと豪語しているが、それを実現したわけではない。 しかし、Vision Pro を使用すると、それが可能であるかのような気分にさせ、没入型、つまり空間コンピューティングが未来のプラットフォームであることを大胆に主張します。
でもちょっと待ってください。 現在のプラットフォームである生成 AI は、空白のフィールドから始まります。 ただし、コンピューターの音声で呪文を唱える必要はなく、選択した自然言語を通じてデジタル世界の力を開くことができます。 単純なプロンプトによって、コンピューター コード、エッセイ、オリジナル アート、新しく作曲された音楽、そして捏造と偏見のパンドラの箱が生成される可能性があります。 コマンドラインはまだ死んでいません。
ジェレミー・ホワイト
ケイト・ニブス
ジェレミー・ホワイト
WIREDスタッフ
Vision Pro の起源は、インターフェイスをより使いやすく、より強力にするための 1960 年代と 70 年代の取り組みに遡ります。 Macintosh についての私の著書『Insanely Great』の中で、PARC のアラン・ケイが Flex という忘れられがちなプロジェクトにどのように取り組んでいたかについて説明しましたが、それは失敗に終わりました。 しかし、学んだ教訓は最終的に Macintosh にインスピレーションを与えた Dynabook につながりました。
[Flex の] 失敗により、ケイは「ユーザー インターフェイス」が何を意味するのかを検討するようになりました。 この用語は一般に、人が自分の希望をコンピュータに伝えることを可能にする一連の画面プロンプトとコマンドを指します。 「コンピュータ・インターフェース設計の慣行は、少なくとも人類がツールを発明して以来存在している」とケイ氏は後に述べた。 しかし、フレンドリーで直感的なコンピューター インターフェイスの促進については、ほとんど考慮されていませんでした。
一般の人が使えるインターフェースをデザインできないだろうか? これは当時、普通の人が腹を立ててコンピューターのキーボードに向かう理由があるとはほとんど考えられていなかった当時、型破りな質問でした。 しかし、ケイはすでにコンピューターに親密に関わる人々のようなアイデアを熟考していました。 彼はマーシャル・マクルーハンの『メディアについて』を読み、その独創的な公言である「メディアはメッセージである」について深く考えていたことに気づきました。 その後、彼は悟りのひらめきを経験し、「今でも反響する衝撃」を20年以上後に『The Art of Human-Computer Interface』に書いた。
「コンピューターは媒体です!私はいつもそれをツール、おそらく乗り物だと考えていました。それははるかに弱い概念です。マクルーハンが言っていたのは、パーソナルコンピューターが本当に新しい媒体であるならば、その使用そのものが実際に変わるだろうということです」文明全体の思考パターンだ。」
グレッグはこう書いている、「『ベター・コール・ソウル』の最初のシーズンでは、老人ホームの過剰請求という小さな事件から始まった事件が、複数の州にわたる企業詐欺事件にまで膨れ上がった。膨大な量の調査が必要だったため、ソールの赤ちゃんは2つの巨大な病院に移植されなければならなかった」これは AI にとって完璧な仕事だろうと思いつきました。しかし、私が読んだすべての記事では、焦点は AI がクリエイティブに与える影響に限定されていました。法律は、この種の強引な研究には最適の候補者のように思えます。 」
グレッグ、どこにいたの? AI はすでに法律の専門家を変革しています。 弁護士に証言録取書や提出書類を丹念に調べさせる代わりに、企業は事件ファイルを調べて分析し、重要な点に焦点を当てる外部サービスを利用できる。 OpenAI 自体は、このプロセスを支援するために法律事務所と提携しています。 ジミー・マッギル(彼はまだソールではなかった)が2002年ではなく2023年にサンドペーパー・クロッシング集団訴訟を起こしていたら、そしてそれがフィクションではなく本物の訴訟だったとしたら、関連する膨大な文書もほぼ確実にAIによって処理されていただろう。大規模な言語モデルのチャットボットが含まれます。 メディアはこの混乱をずっと取り上げてきました。
ジェレミー・ホワイト
ケイト・ニブス
ジェレミー・ホワイト
WIREDスタッフ
しかし、AI がまだできないことの 1 つは、信頼できる裁判所への提出書類を独自に作成することです。 先月、アビアンカ航空に対する訴訟で弁護士が実際の準備書面作成をChatGPTに委託した際、相手方の弁護士はチャットボットが存在しない訴訟の引用や引用を作成していたことを発見した。 ジミーはこれを試してみたでしょうか? それはベター・コール・ソウルの素晴らしいプロットのひねりをもたらしたかもしれません。 しかし、彼の勤勉なパートナー、キム・ウェクスラーが彼の考えを覆しただろうと私は確信している。 おそらくキム氏もAI停止の書簡に署名しただろう。
質問は [email protected] に送信できます。 書くレヴィに聞いてください件名に。
ニューヨークの街がオレンジ色に染まる。 良い意味ではありません。
WIREDはApple Parkの発表会でVision Proについて報じた。
Apple が WWDC で発表したその他のすべては次のとおりです。 15インチのMacBook Airはかなりクールに聞こえます。
ジェレミー・ホワイト
ケイト・ニブス
ジェレミー・ホワイト
WIREDスタッフ
Twitter をクローンしようとしている多くの企業のうちの 1 つについて、深く掘り下げた内容です。
AI が世界の救世主であると宣言したベンチャーキャピタリスト、マーク・アンドリーセンの 7,000 語の聖典に対する逆説的な見解。
ボーナス懸賞プラグイン: WIRED は Speck と提携し、2 人の読者に Samsung Galaxy S23 (Speck ケース 2 個付き) を獲得するチャンスを与えます。 ここに入力。
平文 ASK LEVY