Skip to content
Published on

3Dガウシアン・スプラッティングとフォトグラメトリ 2026 完全ガイド - Nerfstudio · Postshot · Luma Genie · Polycam · Apple Object Capture · RealityCapture 徹底解説

Authors

プロローグ — ポリゴンの時代が終わりつつある風景

2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)であり、RealityCaptureとMetashapeがその頂点だった。

2023年7月、INRIAの一本の論文が風景を変えた。「3D Gaussian Splatting for Real-Time Radiance Field Rendering」 — Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler、George Drettakis。NeRFが1〜5分かかっていた1フレームが、楕円体(ellipsoid)プリミティブ数百万個のアルファ合成に置き換わり、同じ画質が10ms以内で出るようになった。

2026年5月の風景はこうだ。

  • Nerfstudio 1.4が学習パイプラインの事実上の標準。Splatfacto、Splatfacto-W、Splatfacto-MCMCが1コマンドで走る。
  • Postshot 2.0(Jawset)はWindows GUIで、12GBのVRAMから600万ガウシアンを焼く。.ksplatフォーマットがWebの事実上の標準になった。
  • Luma AI Genie 2はテキスト1行で3Dメッシュやスプラットを出す。Interactive Scenesで仮想カメラが自由に回る。
  • PolycamScaniverse 4Apple Object CaptureがモバイルとMacでキャプチャから学習までを面倒みる。
  • RealityCapture 1.5は2024年6月からEpic Gamesの下で完全無料になった。メッシュとスプラットが同じツールに入っている。

本稿は2026年5月の3DGS・フォトグラメトリ・スタックを最初から最後まで整理する。キャプチャ → COLMAP・Hloc → 学習 → エクスポート → Webビューワ。その合間に、韓国・日本の実際の導入事例、学術ベースライン、ライセンスの落とし穴も挟む。


第1章 · 二つのパラダイム — メッシュとスプラット

まず一枚の図から。

[写真100枚]
     |
     v
 [SfM: COLMAP / Hloc / Glomap]
     |
     +-> カメラ姿勢
     +-> 疎な点群
     |
     v
 +---------+        +-------------------+
 |  MVS    |        |  3D Gaussians     |
 | (高密化) |        |  (楕円体数百万)    |
 +---------+        +-------------------+
     |                       |
     v                       v
 [メッシュ .obj/.glb]    [.ply / .splat / .ksplat]
     |                       |
     v                       v
 [ポリゴン描画]          [スプラット約10msラスタライズ]

左の枝がフォトグラメトリ — 写真からメッシュへ。1990年代の航空測量から始まり、RealityCapture・Metashape・Meshroomへと進化した。出力はポリゴン+テクスチャなので、ゲームエンジン・CAD・3Dプリンタにそのまま入る。

右の枝がガウシアン・スプラッティング — 写真から3Dガウシアン楕円体へ。メッシュではなく、位置・共分散・色・不透明度を持つ数百万の柔らかい点が集まって場面を表す。髪・ガラス・煙のような、ポリゴンが表現に苦労した部分が自然に入ってくる。

覚えておく1行: メッシュは触って切る3D、スプラットは見て回る3D。


第2章 · 3DGSの仕組み — 楕円体アルファ合成

3Dガウシアン1つは次の5要素で定義される。

  1. 位置(mean) — 3次元座標 (x, y, z)。
  2. 共分散(covariance) — 3 by 3 行列。実際には回転クォータニオンとスケール・ベクトルに分解して学習する。
  3. 不透明度(opacity) — アルファ値。
  4. SH係数(spherical harmonics) — 視点に依存する色をエンコードする球面調和係数。次数3まで使うと1ガウシアン当たり48値。
  5. 視点依存色 — 上のSHからカメラ方向に合わせて合成された色。

レンダリングは次の順序だ。

1. すべてのガウシアンをカメラ空間へ投影
2. それぞれをスクリーン空間の2Dガウシアンへ圧縮(ヤコビアン近似)
3. 深度順に並べる(front-to-back)
4. 画素ごとにアルファ合成

NeRFが画素ごとに数十〜数百サンプルを積分する(volumetric ray marching) のに対し、3DGSは事前ソート済みのガウシアンを一度に合成する。これが100倍以上の速度差を生む。

学習はSfMが出した疎な点を初期値として、写真を再レンダリングしながら、ガウシアンの位置・共分散・SH・アルファをすべて微分可能に更新する。およそ30,000イテレーションで、写真100枚・1080pの結果が安定する。


第3章 · INRIAの参照実装 — 出発点

原論文の著者陣が公開したコード(graphdeco-inria/gaussian-splatting)は、今もすべての後続研究が比較するベースラインだ。CUDA 11.8以上、VRAM 12GB以上が推奨。

git clone https://github.com/graphdeco-inria/gaussian-splatting --recursive
cd gaussian-splatting
conda env create --file environment.yml
conda activate gaussian_splatting

# COLMAPで写真をカメラ姿勢へ
python convert.py -s data/my_scene

# 学習(30k iter、V100/3090でおよそ30〜60分)
python train.py -s data/my_scene -m output/my_scene

# ビューワ
./SIBR_viewers/install/bin/SIBR_gaussianViewer_app -m output/my_scene

長所: 参照実装なので結果がきれい。短所: Windowsビルドが壊れやすく、学習オプションが少なく、ライセンスが非商用(Non-commercial)。商用案件は別の下流ツールへ移す必要がある。


第4章 · Nerfstudio 1.4 — 事実上の標準パイプライン

UC BerkeleyのKAIR Labが2022年に始めたNerfstudioは、2024年からNeRFというよりむしろ3DGSの標準パイプラインになった。2026年5月時点でバージョン1.4。

インストールは1行。

pip install nerfstudio
ns-install-cli

最短ワークフロー。

# 1. 写真や動画をカメラ姿勢に(COLMAPベース)
ns-process-data images --data /path/photos --output-dir /path/processed

# 2. 学習(Splatfacto = Nerfstudioの3DGS実装)
ns-train splatfacto --data /path/processed

# 3. 学習中にブラウザでビューワが自動起動
# http://localhost:7007

# 4. .plyエクスポート
ns-export gaussian-splat --load-config outputs/.../config.yml --output-dir exports/

主な3つの変種。

  • Splatfacto — 標準実装。INRIAのコードをPyTorchとgsplatの上に整理し直したもの。
  • Splatfacto-W — 動く背景や人をマスクして学習する。街路・旅行写真に強い。Sarafianos et al., 2024。
  • Splatfacto-MCMC — ガウシアン数を自動調整する。メモリ使用が均一。Kheradmand et al., 2024。

学習オプション。ns-train splatfacto --max-num-iterations 30000 --pipeline.model.cull-alpha-thresh 0.005。RTX 3090(24GB)で写真100枚・1080pがおよそ20分。


第5章 · gsplat — Nerfstudioチームのバックエンド

Nerfstudio 1.4が速い理由は、同じチームが別ライブラリgsplatを作ったからだ。INRIAのCUDAカーネルを書き直し、次の機能を加えた。

  • アンチエイリアシング — 3D smoothing filter、Mip-Splattingの統合。
  • MCMCサンプリング — 学習中にガウシアン数を調整。
  • マルチGPU — DDP学習をサポート。
  • 速度 — INRIA比でおよそ4倍の学習速度、50%のメモリ。

自分のプロジェクトにもそのまま組み込める。

import torch
from gsplat import rasterization

# means: (N, 3), quats: (N, 4), scales: (N, 3),
# opacities: (N,), colors: (N, K, 3)  Kは SH係数の数
renders, alphas, info = rasterization(
    means=means,
    quats=quats,
    scales=scales,
    opacities=opacities,
    colors=colors,
    viewmats=viewmats,
    Ks=intrinsics,
    width=W,
    height=H,
    render_mode='RGB',
)

このインターフェイスが標準となり、後続研究(SuGaR、2DGS、SpotlessSplatsなど)もほぼ全部がgsplatの上に乗る。


第6章 · Postshot 2.0 — Windows GUIの決定版

JawsetのPostshotはWindows専用GUIだ。学生・アーティスト・VFXプロが最初に呼ぶ名前であり、2026年に2.0がリリースされた。

主な機能。

  • GUI一発 — フォルダをドロップしてTrainを押すだけ。
  • 複数のプリセット — Fast、Default、Quality。5分〜5時間。
  • モデル・ライブラリ — INRIA、Splatfacto、MCMCをドロップダウンで選ぶ。
  • .ksplatエクスポート — Antimatter15の圧縮フォーマット。Webへそのまま読み込み。
  • マスキングとセグメンテーション — Segment Anything統合で前景・背景分離。

推奨スペック: RTX 3060(12GB)以上、Windows 10/11。12GB VRAMで安定して500〜600万ガウシアン。

ライセンス: 個人と教育は無料、商用は年USD 99のPostshot Plus。

[GUIワークフロー]
写真フォルダ -> Add Project
-> Tracking (COLMAP自動)
-> Train (Qualityプリセット、約60〜90分)
-> Refine (ガウシアンを整理・縮小)
-> Export -> .ksplat

第7章 · Luma AI Genie 2 — テキストと動画を3Dに

Luma AIは2022年にNeRF SDKでスタートし、2024年にGenieでテキスト・トゥ・3Dの戦線に加わった。2026年5月時点でGenie 2。

3つの入口。

  1. Capture(動画) — iPhoneで360度回りながら30〜60秒撮影すると、クラウドで3DGSとNeRFを両方焼いてくれる。
  2. Genie 2(text-to-3D) — 「1970s Volkswagen Beetle in studio light」のようなプロンプトでPBRテクスチャ付きメッシュ。およそ30秒〜2分。
  3. Interactive Scenes — 1枚の写真や短い動画からカメラが自由に回るシーン。WebGL埋め込み対応。

Capture API。

# 動画をアップロード -> 3DGS .plyを受け取る
curl -X POST https://api.lumalabs.ai/dream-machine/v1/captures \
  -H "Authorization: Bearer $LUMA_API_KEY" \
  -F "title=My Capture" \
  -F "media=@capture.mp4"

ライセンス: 個人は無料、Proは月USD 30、APIは従量課金。結果物の商用利用は可能だが、無料プランではLumaのブランド表示が義務。


第8章 · Polycam — モバイルがキャプチャ・デバイスになった瞬間

Polycamは2020年に、iPhone 12 ProのLiDARを本格活用した最初のモバイル・キャプチャ・アプリとして登場した。2026年には次の5つのキャプチャ・モードを揃える。

  1. LiDAR Mode — iPhone/iPad ProのLiDARで直接メッシュ・キャプチャ。
  2. Photo Mode — 写真だけでクラウド側フォトグラメトリ。
  3. Room Mode — 室内の間取りを自動生成、USD/USDZエクスポート。
  4. Gaussian Splat Mode — 動画を撮るとクラウドが.ply・.splatを学習。
  5. Capture API — ドローンやDSLRなど外部カメラの結果をアップロードして学習。

PolycamのWebビューワは、SafariとChromeで100MB級の.splatを滑らかに回す。埋め込みはiframe1行で済む。

ライセンス: 無料プランは一部エクスポート制限あり。Proは月USD 17、Teamは年USD 1,200。韓国・日本の不動産・博物館・建設現場で急速に普及した。

代表事例: 日本の東海大学(Tokai University)建築学科がPolycam Room Modeでキャンパスのデジタル・ツインを2025年に作っている。


第9章 · Apple Object Capture と RealityKit — macOS 15 Sequoia API

Appleは2021年のWWDCでObject Capture APIを発表した(macOS Monterey)。macOS 15 Sequoia(2024年)で洗練され、2026年のmacOS 26ではiPhone Photogrammetryが端末上でメッシュを直接構築する。

最短のSwiftコード。

import RealityKit
import Foundation

let inputFolder = URL(fileURLWithPath: "/path/photos")
let outputURL = URL(fileURLWithPath: "/path/model.usdz")

let session = try PhotogrammetrySession(input: inputFolder)
try session.process(requests: [
    .modelFile(url: outputURL, detail: .full)
])

for try await output in session.outputs {
    switch output {
    case .processingComplete:
        print("done")
    case .requestProgress(_, let fraction):
        print("\(fraction * 100)%")
    default: break
    }
}

要点。

  • USDZ直接出力 — AR Quick LookやVision Pro Immersive Scenesにそのまま入る。
  • 詳細レベル — preview、reduced、medium、full、raw。rawはおよそ1億面。
  • iPhone Photogrammetry(2026) — ProとPro MaxでLiDAR+ARKit深度を組み合わせて精度向上。
  • APIのみ提供 — UIは提供されない。GitHubのサンプル(HelloPhotogrammetry)が補う。

ライセンス費用ゼロ。ハードウェア: M1以上のmacOS、iPhone 12 Pro以上を推奨。


第10章 · RealityCapture 1.5 — 産業級フォトグラメトリが無料に

プラハのCapturing Realityが作ったRealityCaptureは、長く産業の頂点だった。映画VFX・AAAゲームのアセット・文化財デジタル化の標準であり、マビノギ英雄伝、Black Myth: Wukong、ペトラ遺跡デジタル化などに使われた。

2021年にEpic Gamesが買収し、2024年6月から完全無料化された。2026年5月の1.5は次を追加した。

  • 3DGS学習器の統合 — メッシュとスプラットを同じプロジェクトで。
  • 航空LiDAR — 航空レーザー測量と写真の整合。
  • AI Mesh Cleanup — 自動デシメーションと穴埋め。
  • Unreal Engineへの直接エクスポート — Nanite・MetaHuman互換。

推奨スペック: Windows 11、RTX 3080以上、32GB RAM。1000枚単位のプロジェクトが日常的。

ライセンス: 無料だが、Epic Gamesアカウントが必須。メッシュ出力にウォーターマークなし。


第11章 · Scaniverse 4 — NianticのiPhone・Androidキャプチャ

Scaniverseは2020年にiOS LiDARキャプチャ・アプリとしてスタートし、2021年にNianticに買収された。2024年にAndroid版が出て、2026年の4はGaussian Splatモードを中心に据えた。

特徴。

  • 完全無料・無制限 — キャプチャもエクスポートも上限なし。
  • オンデバイス学習 — iPhone 14 Pro以上はクラウドに頼らず端末上で3DGSを学習。
  • GLB・USDZ・PLYエクスポート — メッシュとスプラットの両方。
  • Niantic Lightship連携 — ARゲーム開発にそのまま使える。

キャプチャは1〜3分、学習は3〜10分。画質はPolycamやLumaと同等か若干劣るが、ローカル+無料の組み合わせが決定打。


第12章 · Meshroom 2024.x — AliceVisionのオープンソース陣営

オープンソース・フォトグラメトリで最も完成度が高いのがAliceVision Meshroomだ。2018年から開発が続いており、2024ビルド(GPL v3)はLinux・Windows・macOSすべてに対応。

特徴。

  • ノードベース・パイプライン — Houdini・Nuke風のグラフGUI。
  • CUDA加速 — Dense MatchingとMeshingステージがGPUで動く。
  • 3DGSノード(2024ビルド) — メッシュ化後にガウシアン変換を同じグラフで。

最短ワークフロー。

CameraInit -> FeatureExtraction -> ImageMatching
   -> FeatureMatching -> StructureFromMotion
   -> PrepareDenseScene -> DepthMap -> DepthMapFilter
   -> Meshing -> MeshFiltering -> Texturing

商用利用可、GPL v3。短所: GUIが重く、画質がRealityCaptureやMetashapeに比べて5〜10%劣る。


第13章 · 後続研究 — 2DGS · SuGaR · Mip-Splatting · SpotlessSplats

3DGSは2年で数百本の後続論文を生んだ。2026年5月時点で実際にツール化された5つだけまとめる。

  • 2D Gaussian Splatting(Huang et al., 2024) — 3D楕円体ではなく平面ディスク。表面抽出が正確で、メッシュ変換が自然。Nerfstudioにsplatfacto-2dとして入っている。
  • SuGaR(Guédon et al., 2024) — スプラットからメッシュを取り出す後処理。ゲームエンジンとの互換性のためによく使う。
  • Mip-Splatting(Yu et al., 2024) — 遠くのガウシアンのエイリアシングを軽減。ズームアウト・シーンで決定的。
  • SpotlessSplats(Sabour et al., 2024) — 人や車などの一時的オブジェクトを自動的に無視。Splatfacto-Wの一般化。
  • Compact-3DGS(Lee et al., 2024) — ガウシアン量子化とSH圧縮で.plyサイズを4〜10倍縮小。モバイル・Web配信に必須。

3つ全部を同時に当てた学習が、次のベースラインになる可能性が高い。


第14章 · エクスポート・フォーマット — .ply · .splat · .ksplat

3つのフォーマットが事実上の標準だ。

  • .ply(Stanford PLY) — INRIA、Nerfstudio、gsplatの標準学習出力。非圧縮で数百MB。
  • .splat(Antimatter15) — 1ガウシアン当たり32 bytesに量子化したバイナリ。同じシーンが.ply比5〜10倍小さい。
  • .ksplat(Mark Kellogg) — .splatをさらに圧縮したフォーマット。SHを均一量子化し、ソート情報を事前に埋め込む。Web初回ロードが速い。

変換は通常こうなる。

# Nerfstudioの.plyを.splatへ(Antimatter15のコンバータ)
git clone https://github.com/antimatter15/splat
node splat/convert.js outputs/.../point_cloud/iteration_30000/point_cloud.ply

# .splatを.ksplatへ(Mark Kelloggのgaussian-splats-3d)
npm install -g @mkkellogg/gaussian-splats-3d
gaussian-splats-3d convert input.splat output.ksplat

サイズ比較。

シーン.ply.splat.ksplat
リビング(100枚、1080p)380 MB52 MB28 MB
小物(50枚、720p)110 MB15 MB8 MB
キャンパス(500枚、4K)1.4 GB230 MB140 MB

第15章 · Webビューワ — Three.js · Babylon.js · Antimatter15

2026年のブラウザでガウシアン・スプラットを回す方法は次の3つ。

  • antimatter15/splat — 2023年末の最初のWebGLビューワ。最も軽く、.splatをそのまま受け取る。
  • mkkellogg/gaussian-splats-3d — Three.jsベース。カメラ・ライト・ポストプロセスと自然に組み合わさる。.ksplatが第一級。
  • Babylon.js 7.x・8 — 組み込みのGaussianSplattingメッシュ・クラス。WebGPU経路で最も安定。

Three.js + gaussian-splats-3dの最短例。

import * as THREE from 'three'
import { GaussianSplats3D } from '@mkkellogg/gaussian-splats-3d'

const viewer = new GaussianSplats3D.Viewer({
  selfDrivenMode: true,
  threeScene: new THREE.Scene(),
  useWorkers: true,
})

await viewer.addSplatScene('/scenes/room.ksplat', {
  splatAlphaRemovalThreshold: 5,
  position: [0, 0, 0],
})

viewer.start()

WebGPU経路ではBabylon.js 8(2026年2月)が最速。iPhone 15で300万ガウシアン・60fps程度。


第16章 · キャプチャのベスト・プラクティス — 写真100枚の法則

3DGSとフォトグラメトリの結果の70%はキャプチャで決まる。5つの原則。

  1. 重なり70%以上 — 隣接する写真同士がフレームの70%以上を共有しなければSfMが安定しない。
  2. 3つの高さ — 目線、膝、頭の上。同じ対象を上下から見たビューが必要。
  3. 光は曇りの日 — 直射日光は影が硬くて学習が難しい。曇りの正午が理想。
  4. 反射と透明面を避ける — 鏡やガラスはSfMを壊す。部分的にマスキングが必要。
  5. 動くオブジェクトは可能な限り除外 — 人や車が映り込んだらSpotlessSplatsかSplatfacto-Wでマスキング。

推奨枚数。小物50枚、1部屋100〜200枚、建物外観300〜500枚、キャンパス1,000枚以上。

撮影パターン。

小物   -> 360度の円周 + 上下の段(計3周)
部屋   -> 壁伝いに1周 + 天井1パス
建物   -> 外周4面 + 上空1枚(ドローン)
庭園   -> グリッド状に6〜10本の平行線

第17章 · 韓国・日本の導入事例

2024〜2025年に韓国・日本で目立った導入が次の5つ。

  • LG U+ ARグラス・コンテンツチーム — Polycam Capture APIでソウル市内の名所を3DGSキャプチャし、ARガイド・コンテンツを制作(2024)。
  • 国立中央博物館(韓国) — RealityCapture + 自前学習パイプラインで青磁象嵌雲鶴文梅瓶のデジタル・ツインを作り、Web embedで公開(2025)。
  • POSCO・現代E&CのBIMチーム — Polycam Room Mode + USDZエクスポートで現場進捗トラッキング。
  • 東海大学(Tokai University・日本) — Polycam Gaussian Splatでキャンパス全体をキャプチャし、新入生向け仮想ツアーを実装(2025)。
  • 凸版印刷(Toppan Printing・日本) — 文化財3DアーカイブをMetashapeからNerfstudioへ移行(2024)。結果は東海道新幹線の駅のデジタル・サイネージで配信。

共通点: 既存の写真や映像資産を新パイプラインで焼き直す作業が、新規キャプチャより導入を加速させた点。


第18章 · Apple Vision Pro · Immersive Scenes · Reality Composer Pro 2.0

2024年のApple Vision Pro出荷後、2025年のvisionOS 2がImmersive Scenes APIを安定化させた。Reality Composer Pro 2.0(macOS 15 Sequoia)はUSDZを直接編集し、ガウシアン・スプラッティングを部分的にインポートする。

最短ワークフロー。

1. RealityCapture / Object Capture -> .usdzメッシュ
2. Reality Composer Pro 2.0でマテリアル・アンカーを編集
3. visionOS XcodeプロジェクトのRealityKitスコープに差し込み
4. ImmersiveSpaceで6DoF表示

3DGSのネイティブ・インポートはまだ未対応だが、Antimatter15のWebGLビューワをVision Pro Safariでそのまま動かすのが事実上の回避路。ネイティブ統合はvisionOS 3(2026年後半予想)で。


第19章 · ライセンス・マトリクス

ツールライセンス商用利用ウォーターマーク
INRIA gaussian-splatting非商用不可-
NerfstudioApache 2.0なし
gsplatApache 2.0なし
Postshot個人無料、年USD 99商用可(有料)なし
Luma AI Genie無料 / 月USD 30 Pro無料プランはLumaブランド
Polycam無料 / 月USD 17 Pro一部無料、エクスポート制限Proはなし
Apple Object CaptureAppleライセンスなし
RealityCapture 1.5無料(Epicアカウント)なし
Scaniverse 4無料なし
MeshroomGPL v3可(ソース開示条件)なし

商用案件の分岐。学術ベースライン比較ならINRIA原本自社サービスへの埋め込みならNerfstudio + gsplatGUIで早く焼きたいなら有料Postshotモバイル・現場ならPolycam ProかScaniverse


第20章 · 一枚で見る決定マトリクス

シナリオ第1選択第2選択備考
iPhoneで素早くキャプチャScaniverse 4Polycamどちらもオンデバイス
写真100枚・デスクトップPostshot 2.0NerfstudioGUI対CLI
学術ベースラインINRIA原本Nerfstudio非商用注意
自社サービスへ組み込みNerfstudio + .ksplatLuma Capture APIライセンスとコスト
AR Quick LookやVision ProApple Object CaptureRealityCaptureUSDZ直出力
映像VFX・ゲーム・アセットRealityCapture 1.5MetashapeUnreal統合
文化財・博物館Metashape + NerfstudioRealityCapture精度
テキストから即生成Luma Genie 2Meshy / Tripoメッシュ出力
オープンソース義務Meshroom + NerfstudiogsplatGPL / Apache

第21章 · これからの半年を一行で

3DGSの次の2四半期は3つに絞れる。

  1. Dynamic Gaussian Splatting — 時間軸が加わった4Dスプラッティング。映像のなかでガウシアンが動く。2024年の4DGS論文が出発点。2026年にはNerfstudioにネイティブ統合が予定されている。
  2. AIアラインメント — ガウシアンから意味(semantic)ラベルを自動抽出し、「この椅子だけ選んで」のような操作を可能にする。LangSplatとFeature 3DGSがこの前線。
  3. モバイル学習 — Scaniverse 4が最初の一歩を踏んだ。端末上学習が一般化すれば、クラウド・コスト・ゼロでキャプチャから視聴までが標準になる。

覚えておく1行: 2026年の3Dは「撮って触る3D」だ。 ポリゴンもテクスチャも知らない人が写真数枚で3Dを作り、そこにプロンプト1行でディテールを足す。3DGSはその最短の道。


第22章 · 次の一歩 — 1週間の学習プラン

この記事を読み終えたなら、次の7日間をこう使ってみると良い。

  • Day 1 — iPhoneでデスクの小物をScaniverse 4で撮ってみる。
  • Day 2 — 同じ写真をPolycam Photo Modeにアップロードして結果を比較。
  • Day 3 — デスクトップにPostshot 2.0を入れ、同じ素材を再学習する。
  • Day 4 — Nerfstudio 1.4を入れてns-train splatfactoで同じデータを学習する。
  • Day 5 — 結果の.plyを.ksplatに変換し、Three.js + gaussian-splats-3dでWebに表示する。
  • Day 6 — RealityCapture 1.5で同じ写真をメッシュとして受け取り、2つの表現の違いを観る。
  • Day 7 — 自分の部屋を200枚撮り、本格的な最初のシーンを作る。

キャプチャはツールの操作ではなく、目の訓練だ。1週間で「このシーンを撮るとこう焼ける」という直感が身につく。


参考資料