- Published on
3Dガウシアン・スプラッティングとフォトグラメトリ 2026 完全ガイド - Nerfstudio · Postshot · Luma Genie · Polycam · Apple Object Capture · RealityCapture 徹底解説
- Authors

- Name
- Youngju Kim
- @fjvbn20031
プロローグ — ポリゴンの時代が終わりつつある風景
2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)であり、RealityCaptureとMetashapeがその頂点だった。
2023年7月、INRIAの一本の論文が風景を変えた。「3D Gaussian Splatting for Real-Time Radiance Field Rendering」 — Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler、George Drettakis。NeRFが1〜5分かかっていた1フレームが、楕円体(ellipsoid)プリミティブ数百万個のアルファ合成に置き換わり、同じ画質が10ms以内で出るようになった。
2026年5月の風景はこうだ。
- Nerfstudio 1.4が学習パイプラインの事実上の標準。Splatfacto、Splatfacto-W、Splatfacto-MCMCが1コマンドで走る。
- Postshot 2.0(Jawset)はWindows GUIで、12GBのVRAMから600万ガウシアンを焼く。
.ksplatフォーマットがWebの事実上の標準になった。 - Luma AI Genie 2はテキスト1行で3Dメッシュやスプラットを出す。Interactive Scenesで仮想カメラが自由に回る。
- Polycam・Scaniverse 4・Apple Object CaptureがモバイルとMacでキャプチャから学習までを面倒みる。
- RealityCapture 1.5は2024年6月からEpic Gamesの下で完全無料になった。メッシュとスプラットが同じツールに入っている。
本稿は2026年5月の3DGS・フォトグラメトリ・スタックを最初から最後まで整理する。キャプチャ → COLMAP・Hloc → 学習 → エクスポート → Webビューワ。その合間に、韓国・日本の実際の導入事例、学術ベースライン、ライセンスの落とし穴も挟む。
第1章 · 二つのパラダイム — メッシュとスプラット
まず一枚の図から。
[写真100枚]
|
v
[SfM: COLMAP / Hloc / Glomap]
|
+-> カメラ姿勢
+-> 疎な点群
|
v
+---------+ +-------------------+
| MVS | | 3D Gaussians |
| (高密化) | | (楕円体数百万) |
+---------+ +-------------------+
| |
v v
[メッシュ .obj/.glb] [.ply / .splat / .ksplat]
| |
v v
[ポリゴン描画] [スプラット約10msラスタライズ]
左の枝がフォトグラメトリ — 写真からメッシュへ。1990年代の航空測量から始まり、RealityCapture・Metashape・Meshroomへと進化した。出力はポリゴン+テクスチャなので、ゲームエンジン・CAD・3Dプリンタにそのまま入る。
右の枝がガウシアン・スプラッティング — 写真から3Dガウシアン楕円体へ。メッシュではなく、位置・共分散・色・不透明度を持つ数百万の柔らかい点が集まって場面を表す。髪・ガラス・煙のような、ポリゴンが表現に苦労した部分が自然に入ってくる。
覚えておく1行: メッシュは触って切る3D、スプラットは見て回る3D。
第2章 · 3DGSの仕組み — 楕円体アルファ合成
3Dガウシアン1つは次の5要素で定義される。
- 位置(mean) — 3次元座標 (x, y, z)。
- 共分散(covariance) — 3 by 3 行列。実際には回転クォータニオンとスケール・ベクトルに分解して学習する。
- 不透明度(opacity) — アルファ値。
- SH係数(spherical harmonics) — 視点に依存する色をエンコードする球面調和係数。次数3まで使うと1ガウシアン当たり48値。
- 視点依存色 — 上のSHからカメラ方向に合わせて合成された色。
レンダリングは次の順序だ。
1. すべてのガウシアンをカメラ空間へ投影
2. それぞれをスクリーン空間の2Dガウシアンへ圧縮(ヤコビアン近似)
3. 深度順に並べる(front-to-back)
4. 画素ごとにアルファ合成
NeRFが画素ごとに数十〜数百サンプルを積分する(volumetric ray marching) のに対し、3DGSは事前ソート済みのガウシアンを一度に合成する。これが100倍以上の速度差を生む。
学習はSfMが出した疎な点を初期値として、写真を再レンダリングしながら、ガウシアンの位置・共分散・SH・アルファをすべて微分可能に更新する。およそ30,000イテレーションで、写真100枚・1080pの結果が安定する。
第3章 · INRIAの参照実装 — 出発点
原論文の著者陣が公開したコード(graphdeco-inria/gaussian-splatting)は、今もすべての後続研究が比較するベースラインだ。CUDA 11.8以上、VRAM 12GB以上が推奨。
git clone https://github.com/graphdeco-inria/gaussian-splatting --recursive
cd gaussian-splatting
conda env create --file environment.yml
conda activate gaussian_splatting
# COLMAPで写真をカメラ姿勢へ
python convert.py -s data/my_scene
# 学習(30k iter、V100/3090でおよそ30〜60分)
python train.py -s data/my_scene -m output/my_scene
# ビューワ
./SIBR_viewers/install/bin/SIBR_gaussianViewer_app -m output/my_scene
長所: 参照実装なので結果がきれい。短所: Windowsビルドが壊れやすく、学習オプションが少なく、ライセンスが非商用(Non-commercial)。商用案件は別の下流ツールへ移す必要がある。
第4章 · Nerfstudio 1.4 — 事実上の標準パイプライン
UC BerkeleyのKAIR Labが2022年に始めたNerfstudioは、2024年からNeRFというよりむしろ3DGSの標準パイプラインになった。2026年5月時点でバージョン1.4。
インストールは1行。
pip install nerfstudio
ns-install-cli
最短ワークフロー。
# 1. 写真や動画をカメラ姿勢に(COLMAPベース)
ns-process-data images --data /path/photos --output-dir /path/processed
# 2. 学習(Splatfacto = Nerfstudioの3DGS実装)
ns-train splatfacto --data /path/processed
# 3. 学習中にブラウザでビューワが自動起動
# http://localhost:7007
# 4. .plyエクスポート
ns-export gaussian-splat --load-config outputs/.../config.yml --output-dir exports/
主な3つの変種。
- Splatfacto — 標準実装。INRIAのコードをPyTorchとgsplatの上に整理し直したもの。
- Splatfacto-W — 動く背景や人をマスクして学習する。街路・旅行写真に強い。Sarafianos et al., 2024。
- Splatfacto-MCMC — ガウシアン数を自動調整する。メモリ使用が均一。Kheradmand et al., 2024。
学習オプション。ns-train splatfacto --max-num-iterations 30000 --pipeline.model.cull-alpha-thresh 0.005。RTX 3090(24GB)で写真100枚・1080pがおよそ20分。
第5章 · gsplat — Nerfstudioチームのバックエンド
Nerfstudio 1.4が速い理由は、同じチームが別ライブラリgsplatを作ったからだ。INRIAのCUDAカーネルを書き直し、次の機能を加えた。
- アンチエイリアシング — 3D smoothing filter、Mip-Splattingの統合。
- MCMCサンプリング — 学習中にガウシアン数を調整。
- マルチGPU — DDP学習をサポート。
- 速度 — INRIA比でおよそ4倍の学習速度、50%のメモリ。
自分のプロジェクトにもそのまま組み込める。
import torch
from gsplat import rasterization
# means: (N, 3), quats: (N, 4), scales: (N, 3),
# opacities: (N,), colors: (N, K, 3) Kは SH係数の数
renders, alphas, info = rasterization(
means=means,
quats=quats,
scales=scales,
opacities=opacities,
colors=colors,
viewmats=viewmats,
Ks=intrinsics,
width=W,
height=H,
render_mode='RGB',
)
このインターフェイスが標準となり、後続研究(SuGaR、2DGS、SpotlessSplatsなど)もほぼ全部がgsplatの上に乗る。
第6章 · Postshot 2.0 — Windows GUIの決定版
JawsetのPostshotはWindows専用GUIだ。学生・アーティスト・VFXプロが最初に呼ぶ名前であり、2026年に2.0がリリースされた。
主な機能。
- GUI一発 — フォルダをドロップしてTrainを押すだけ。
- 複数のプリセット — Fast、Default、Quality。5分〜5時間。
- モデル・ライブラリ — INRIA、Splatfacto、MCMCをドロップダウンで選ぶ。
- .ksplatエクスポート — Antimatter15の圧縮フォーマット。Webへそのまま読み込み。
- マスキングとセグメンテーション — Segment Anything統合で前景・背景分離。
推奨スペック: RTX 3060(12GB)以上、Windows 10/11。12GB VRAMで安定して500〜600万ガウシアン。
ライセンス: 個人と教育は無料、商用は年USD 99のPostshot Plus。
[GUIワークフロー]
写真フォルダ -> Add Project
-> Tracking (COLMAP自動)
-> Train (Qualityプリセット、約60〜90分)
-> Refine (ガウシアンを整理・縮小)
-> Export -> .ksplat
第7章 · Luma AI Genie 2 — テキストと動画を3Dに
Luma AIは2022年にNeRF SDKでスタートし、2024年にGenieでテキスト・トゥ・3Dの戦線に加わった。2026年5月時点でGenie 2。
3つの入口。
- Capture(動画) — iPhoneで360度回りながら30〜60秒撮影すると、クラウドで3DGSとNeRFを両方焼いてくれる。
- Genie 2(text-to-3D) — 「1970s Volkswagen Beetle in studio light」のようなプロンプトでPBRテクスチャ付きメッシュ。およそ30秒〜2分。
- Interactive Scenes — 1枚の写真や短い動画からカメラが自由に回るシーン。WebGL埋め込み対応。
Capture API。
# 動画をアップロード -> 3DGS .plyを受け取る
curl -X POST https://api.lumalabs.ai/dream-machine/v1/captures \
-H "Authorization: Bearer $LUMA_API_KEY" \
-F "title=My Capture" \
-F "media=@capture.mp4"
ライセンス: 個人は無料、Proは月USD 30、APIは従量課金。結果物の商用利用は可能だが、無料プランではLumaのブランド表示が義務。
第8章 · Polycam — モバイルがキャプチャ・デバイスになった瞬間
Polycamは2020年に、iPhone 12 ProのLiDARを本格活用した最初のモバイル・キャプチャ・アプリとして登場した。2026年には次の5つのキャプチャ・モードを揃える。
- LiDAR Mode — iPhone/iPad ProのLiDARで直接メッシュ・キャプチャ。
- Photo Mode — 写真だけでクラウド側フォトグラメトリ。
- Room Mode — 室内の間取りを自動生成、USD/USDZエクスポート。
- Gaussian Splat Mode — 動画を撮るとクラウドが.ply・.splatを学習。
- Capture API — ドローンやDSLRなど外部カメラの結果をアップロードして学習。
PolycamのWebビューワは、SafariとChromeで100MB級の.splatを滑らかに回す。埋め込みはiframe1行で済む。
ライセンス: 無料プランは一部エクスポート制限あり。Proは月USD 17、Teamは年USD 1,200。韓国・日本の不動産・博物館・建設現場で急速に普及した。
代表事例: 日本の東海大学(Tokai University)建築学科がPolycam Room Modeでキャンパスのデジタル・ツインを2025年に作っている。
第9章 · Apple Object Capture と RealityKit — macOS 15 Sequoia API
Appleは2021年のWWDCでObject Capture APIを発表した(macOS Monterey)。macOS 15 Sequoia(2024年)で洗練され、2026年のmacOS 26ではiPhone Photogrammetryが端末上でメッシュを直接構築する。
最短のSwiftコード。
import RealityKit
import Foundation
let inputFolder = URL(fileURLWithPath: "/path/photos")
let outputURL = URL(fileURLWithPath: "/path/model.usdz")
let session = try PhotogrammetrySession(input: inputFolder)
try session.process(requests: [
.modelFile(url: outputURL, detail: .full)
])
for try await output in session.outputs {
switch output {
case .processingComplete:
print("done")
case .requestProgress(_, let fraction):
print("\(fraction * 100)%")
default: break
}
}
要点。
- USDZ直接出力 — AR Quick LookやVision Pro Immersive Scenesにそのまま入る。
- 詳細レベル — preview、reduced、medium、full、raw。rawはおよそ1億面。
- iPhone Photogrammetry(2026) — ProとPro MaxでLiDAR+ARKit深度を組み合わせて精度向上。
- APIのみ提供 — UIは提供されない。GitHubのサンプル(
HelloPhotogrammetry)が補う。
ライセンス費用ゼロ。ハードウェア: M1以上のmacOS、iPhone 12 Pro以上を推奨。
第10章 · RealityCapture 1.5 — 産業級フォトグラメトリが無料に
プラハのCapturing Realityが作ったRealityCaptureは、長く産業の頂点だった。映画VFX・AAAゲームのアセット・文化財デジタル化の標準であり、マビノギ英雄伝、Black Myth: Wukong、ペトラ遺跡デジタル化などに使われた。
2021年にEpic Gamesが買収し、2024年6月から完全無料化された。2026年5月の1.5は次を追加した。
- 3DGS学習器の統合 — メッシュとスプラットを同じプロジェクトで。
- 航空LiDAR — 航空レーザー測量と写真の整合。
- AI Mesh Cleanup — 自動デシメーションと穴埋め。
- Unreal Engineへの直接エクスポート — Nanite・MetaHuman互換。
推奨スペック: Windows 11、RTX 3080以上、32GB RAM。1000枚単位のプロジェクトが日常的。
ライセンス: 無料だが、Epic Gamesアカウントが必須。メッシュ出力にウォーターマークなし。
第11章 · Scaniverse 4 — NianticのiPhone・Androidキャプチャ
Scaniverseは2020年にiOS LiDARキャプチャ・アプリとしてスタートし、2021年にNianticに買収された。2024年にAndroid版が出て、2026年の4はGaussian Splatモードを中心に据えた。
特徴。
- 完全無料・無制限 — キャプチャもエクスポートも上限なし。
- オンデバイス学習 — iPhone 14 Pro以上はクラウドに頼らず端末上で3DGSを学習。
- GLB・USDZ・PLYエクスポート — メッシュとスプラットの両方。
- Niantic Lightship連携 — ARゲーム開発にそのまま使える。
キャプチャは1〜3分、学習は3〜10分。画質はPolycamやLumaと同等か若干劣るが、ローカル+無料の組み合わせが決定打。
第12章 · Meshroom 2024.x — AliceVisionのオープンソース陣営
オープンソース・フォトグラメトリで最も完成度が高いのがAliceVision Meshroomだ。2018年から開発が続いており、2024ビルド(GPL v3)はLinux・Windows・macOSすべてに対応。
特徴。
- ノードベース・パイプライン — Houdini・Nuke風のグラフGUI。
- CUDA加速 — Dense MatchingとMeshingステージがGPUで動く。
- 3DGSノード(2024ビルド) — メッシュ化後にガウシアン変換を同じグラフで。
最短ワークフロー。
CameraInit -> FeatureExtraction -> ImageMatching
-> FeatureMatching -> StructureFromMotion
-> PrepareDenseScene -> DepthMap -> DepthMapFilter
-> Meshing -> MeshFiltering -> Texturing
商用利用可、GPL v3。短所: GUIが重く、画質がRealityCaptureやMetashapeに比べて5〜10%劣る。
第13章 · 後続研究 — 2DGS · SuGaR · Mip-Splatting · SpotlessSplats
3DGSは2年で数百本の後続論文を生んだ。2026年5月時点で実際にツール化された5つだけまとめる。
- 2D Gaussian Splatting(Huang et al., 2024) — 3D楕円体ではなく平面ディスク。表面抽出が正確で、メッシュ変換が自然。Nerfstudioに
splatfacto-2dとして入っている。 - SuGaR(Guédon et al., 2024) — スプラットからメッシュを取り出す後処理。ゲームエンジンとの互換性のためによく使う。
- Mip-Splatting(Yu et al., 2024) — 遠くのガウシアンのエイリアシングを軽減。ズームアウト・シーンで決定的。
- SpotlessSplats(Sabour et al., 2024) — 人や車などの一時的オブジェクトを自動的に無視。Splatfacto-Wの一般化。
- Compact-3DGS(Lee et al., 2024) — ガウシアン量子化とSH圧縮で.plyサイズを4〜10倍縮小。モバイル・Web配信に必須。
3つ全部を同時に当てた学習が、次のベースラインになる可能性が高い。
第14章 · エクスポート・フォーマット — .ply · .splat · .ksplat
3つのフォーマットが事実上の標準だ。
- .ply(Stanford PLY) — INRIA、Nerfstudio、gsplatの標準学習出力。非圧縮で数百MB。
- .splat(Antimatter15) — 1ガウシアン当たり32 bytesに量子化したバイナリ。同じシーンが.ply比5〜10倍小さい。
- .ksplat(Mark Kellogg) — .splatをさらに圧縮したフォーマット。SHを均一量子化し、ソート情報を事前に埋め込む。Web初回ロードが速い。
変換は通常こうなる。
# Nerfstudioの.plyを.splatへ(Antimatter15のコンバータ)
git clone https://github.com/antimatter15/splat
node splat/convert.js outputs/.../point_cloud/iteration_30000/point_cloud.ply
# .splatを.ksplatへ(Mark Kelloggのgaussian-splats-3d)
npm install -g @mkkellogg/gaussian-splats-3d
gaussian-splats-3d convert input.splat output.ksplat
サイズ比較。
| シーン | .ply | .splat | .ksplat |
|---|---|---|---|
| リビング(100枚、1080p) | 380 MB | 52 MB | 28 MB |
| 小物(50枚、720p) | 110 MB | 15 MB | 8 MB |
| キャンパス(500枚、4K) | 1.4 GB | 230 MB | 140 MB |
第15章 · Webビューワ — Three.js · Babylon.js · Antimatter15
2026年のブラウザでガウシアン・スプラットを回す方法は次の3つ。
- antimatter15/splat — 2023年末の最初のWebGLビューワ。最も軽く、.splatをそのまま受け取る。
- mkkellogg/gaussian-splats-3d — Three.jsベース。カメラ・ライト・ポストプロセスと自然に組み合わさる。.ksplatが第一級。
- Babylon.js 7.x・8 — 組み込みの
GaussianSplattingメッシュ・クラス。WebGPU経路で最も安定。
Three.js + gaussian-splats-3dの最短例。
import * as THREE from 'three'
import { GaussianSplats3D } from '@mkkellogg/gaussian-splats-3d'
const viewer = new GaussianSplats3D.Viewer({
selfDrivenMode: true,
threeScene: new THREE.Scene(),
useWorkers: true,
})
await viewer.addSplatScene('/scenes/room.ksplat', {
splatAlphaRemovalThreshold: 5,
position: [0, 0, 0],
})
viewer.start()
WebGPU経路ではBabylon.js 8(2026年2月)が最速。iPhone 15で300万ガウシアン・60fps程度。
第16章 · キャプチャのベスト・プラクティス — 写真100枚の法則
3DGSとフォトグラメトリの結果の70%はキャプチャで決まる。5つの原則。
- 重なり70%以上 — 隣接する写真同士がフレームの70%以上を共有しなければSfMが安定しない。
- 3つの高さ — 目線、膝、頭の上。同じ対象を上下から見たビューが必要。
- 光は曇りの日 — 直射日光は影が硬くて学習が難しい。曇りの正午が理想。
- 反射と透明面を避ける — 鏡やガラスはSfMを壊す。部分的にマスキングが必要。
- 動くオブジェクトは可能な限り除外 — 人や車が映り込んだらSpotlessSplatsかSplatfacto-Wでマスキング。
推奨枚数。小物50枚、1部屋100〜200枚、建物外観300〜500枚、キャンパス1,000枚以上。
撮影パターン。
小物 -> 360度の円周 + 上下の段(計3周)
部屋 -> 壁伝いに1周 + 天井1パス
建物 -> 外周4面 + 上空1枚(ドローン)
庭園 -> グリッド状に6〜10本の平行線
第17章 · 韓国・日本の導入事例
2024〜2025年に韓国・日本で目立った導入が次の5つ。
- LG U+ ARグラス・コンテンツチーム — Polycam Capture APIでソウル市内の名所を3DGSキャプチャし、ARガイド・コンテンツを制作(2024)。
- 国立中央博物館(韓国) — RealityCapture + 自前学習パイプラインで青磁象嵌雲鶴文梅瓶のデジタル・ツインを作り、Web embedで公開(2025)。
- POSCO・現代E&CのBIMチーム — Polycam Room Mode + USDZエクスポートで現場進捗トラッキング。
- 東海大学(Tokai University・日本) — Polycam Gaussian Splatでキャンパス全体をキャプチャし、新入生向け仮想ツアーを実装(2025)。
- 凸版印刷(Toppan Printing・日本) — 文化財3DアーカイブをMetashapeからNerfstudioへ移行(2024)。結果は東海道新幹線の駅のデジタル・サイネージで配信。
共通点: 既存の写真や映像資産を新パイプラインで焼き直す作業が、新規キャプチャより導入を加速させた点。
第18章 · Apple Vision Pro · Immersive Scenes · Reality Composer Pro 2.0
2024年のApple Vision Pro出荷後、2025年のvisionOS 2がImmersive Scenes APIを安定化させた。Reality Composer Pro 2.0(macOS 15 Sequoia)はUSDZを直接編集し、ガウシアン・スプラッティングを部分的にインポートする。
最短ワークフロー。
1. RealityCapture / Object Capture -> .usdzメッシュ
2. Reality Composer Pro 2.0でマテリアル・アンカーを編集
3. visionOS XcodeプロジェクトのRealityKitスコープに差し込み
4. ImmersiveSpaceで6DoF表示
3DGSのネイティブ・インポートはまだ未対応だが、Antimatter15のWebGLビューワをVision Pro Safariでそのまま動かすのが事実上の回避路。ネイティブ統合はvisionOS 3(2026年後半予想)で。
第19章 · ライセンス・マトリクス
| ツール | ライセンス | 商用利用 | ウォーターマーク |
|---|---|---|---|
| INRIA gaussian-splatting | 非商用 | 不可 | - |
| Nerfstudio | Apache 2.0 | 可 | なし |
| gsplat | Apache 2.0 | 可 | なし |
| Postshot | 個人無料、年USD 99商用 | 可(有料) | なし |
| Luma AI Genie | 無料 / 月USD 30 Pro | 可 | 無料プランはLumaブランド |
| Polycam | 無料 / 月USD 17 Pro | 一部無料、エクスポート制限 | Proはなし |
| Apple Object Capture | Appleライセンス | 可 | なし |
| RealityCapture 1.5 | 無料(Epicアカウント) | 可 | なし |
| Scaniverse 4 | 無料 | 可 | なし |
| Meshroom | GPL v3 | 可(ソース開示条件) | なし |
商用案件の分岐。学術ベースライン比較ならINRIA原本、自社サービスへの埋め込みならNerfstudio + gsplat、GUIで早く焼きたいなら有料Postshot、モバイル・現場ならPolycam ProかScaniverse。
第20章 · 一枚で見る決定マトリクス
| シナリオ | 第1選択 | 第2選択 | 備考 |
|---|---|---|---|
| iPhoneで素早くキャプチャ | Scaniverse 4 | Polycam | どちらもオンデバイス |
| 写真100枚・デスクトップ | Postshot 2.0 | Nerfstudio | GUI対CLI |
| 学術ベースライン | INRIA原本 | Nerfstudio | 非商用注意 |
| 自社サービスへ組み込み | Nerfstudio + .ksplat | Luma Capture API | ライセンスとコスト |
| AR Quick LookやVision Pro | Apple Object Capture | RealityCapture | USDZ直出力 |
| 映像VFX・ゲーム・アセット | RealityCapture 1.5 | Metashape | Unreal統合 |
| 文化財・博物館 | Metashape + Nerfstudio | RealityCapture | 精度 |
| テキストから即生成 | Luma Genie 2 | Meshy / Tripo | メッシュ出力 |
| オープンソース義務 | Meshroom + Nerfstudio | gsplat | GPL / Apache |
第21章 · これからの半年を一行で
3DGSの次の2四半期は3つに絞れる。
- Dynamic Gaussian Splatting — 時間軸が加わった4Dスプラッティング。映像のなかでガウシアンが動く。2024年の4DGS論文が出発点。2026年にはNerfstudioにネイティブ統合が予定されている。
- AIアラインメント — ガウシアンから意味(semantic)ラベルを自動抽出し、「この椅子だけ選んで」のような操作を可能にする。LangSplatとFeature 3DGSがこの前線。
- モバイル学習 — Scaniverse 4が最初の一歩を踏んだ。端末上学習が一般化すれば、クラウド・コスト・ゼロでキャプチャから視聴までが標準になる。
覚えておく1行: 2026年の3Dは「撮って触る3D」だ。 ポリゴンもテクスチャも知らない人が写真数枚で3Dを作り、そこにプロンプト1行でディテールを足す。3DGSはその最短の道。
第22章 · 次の一歩 — 1週間の学習プラン
この記事を読み終えたなら、次の7日間をこう使ってみると良い。
- Day 1 — iPhoneでデスクの小物をScaniverse 4で撮ってみる。
- Day 2 — 同じ写真をPolycam Photo Modeにアップロードして結果を比較。
- Day 3 — デスクトップにPostshot 2.0を入れ、同じ素材を再学習する。
- Day 4 — Nerfstudio 1.4を入れて
ns-train splatfactoで同じデータを学習する。 - Day 5 — 結果の.plyを.ksplatに変換し、Three.js + gaussian-splats-3dでWebに表示する。
- Day 6 — RealityCapture 1.5で同じ写真をメッシュとして受け取り、2つの表現の違いを観る。
- Day 7 — 自分の部屋を200枚撮り、本格的な最初のシーンを作る。
キャプチャはツールの操作ではなく、目の訓練だ。1週間で「このシーンを撮るとこう焼ける」という直感が身につく。
参考資料
- 3D Gaussian Splatting原論文 - https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
- INRIA gaussian-splattingコード - https://github.com/graphdeco-inria/gaussian-splatting
- Nerfstudio公式 - https://docs.nerf.studio/
- Nerfstudio Splatfactoドキュメント - https://docs.nerf.studio/nerfology/methods/splat.html
- gsplatライブラリ - https://github.com/nerfstudio-project/gsplat
- Postshot (Jawset) - https://www.jawset.com/
- Luma AI - https://lumalabs.ai/
- Luma Genie - https://lumalabs.ai/genie
- Polycam - https://poly.cam/
- Apple Object Capture - https://developer.apple.com/augmented-reality/object-capture/
- Apple PhotogrammetrySession API - https://developer.apple.com/documentation/realitykit/photogrammetrysession
- RealityCapture - https://www.capturingreality.com/
- Scaniverse - https://scaniverse.com/
- AliceVision Meshroom - https://alicevision.org/
- 2D Gaussian Splatting論文 - https://surfsplatting.github.io/
- SuGaRプロジェクト - https://anttwo.github.io/sugar/
- Mip-Splatting - https://niujinshuchong.github.io/mip-splatting/
- SpotlessSplats - https://spotlesssplats.github.io/
- Antimatter15 splatビューワ - https://github.com/antimatter15/splat
- Mark Kellogg gaussian-splats-3d - https://github.com/mkkellogg/GaussianSplats3D
- Babylon.js Gaussian Splatting - https://doc.babylonjs.com/features/featuresDeepDive/mesh/gaussianSplatting
- Reality Composer Pro 2.0 - https://developer.apple.com/augmented-reality/tools/
- COLMAP - https://colmap.github.io/
- Hloc (Hierarchical Localization) - https://github.com/cvg/Hierarchical-Localization