필사 모드: 3Dガウシアン・スプラッティングとフォトグラメトリ 2026 完全ガイド - Nerfstudio · Postshot · Luma Genie · Polycam · Apple Object Capture · RealityCapture 徹底解説
日本語プロローグ — ポリゴンの時代が終わりつつある風景
2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)であり、RealityCaptureとMetashapeがその頂点だった。
2023年7月、INRIAの一本の論文が風景を変えた。「3D Gaussian Splatting for Real-Time Radiance Field Rendering」 — Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler、George Drettakis。NeRFが1〜5分かかっていた1フレームが、**楕円体(ellipsoid)プリミティブ数百万個**のアルファ合成に置き換わり、同じ画質が**10ms以内**で出るようになった。
2026年5月の風景はこうだ。
- **Nerfstudio 1.4**が学習パイプラインの事実上の標準。Splatfacto、Splatfacto-W、Splatfacto-MCMCが1コマンドで走る。
- **Postshot 2.0**(Jawset)はWindows GUIで、12GBのVRAMから600万ガウシアンを焼く。`.ksplat`フォーマットがWebの事実上の標準になった。
- **Luma AI Genie 2**はテキスト1行で3Dメッシュやスプラットを出す。Interactive Scenesで仮想カメラが自由に回る。
- **Polycam**・**Scaniverse 4**・**Apple Object Capture**がモバイルとMacでキャプチャから学習までを面倒みる。
- **RealityCapture 1.5**は2024年6月からEpic Gamesの下で**完全無料**になった。メッシュとスプラットが同じツールに入っている。
本稿は2026年5月の3DGS・フォトグラメトリ・スタックを最初から最後まで整理する。キャプチャ → COLMAP・Hloc → 学習 → エクスポート → Webビューワ。その合間に、韓国・日本の実際の導入事例、学術ベースライン、ライセンスの落とし穴も挟む。
第1章 · 二つのパラダイム — メッシュとスプラット
まず一枚の図から。
[写真100枚]
|
v
[SfM: COLMAP / Hloc / Glomap]
|
+-> カメラ姿勢
+-> 疎な点群
|
v
+---------+ +-------------------+
| MVS | | 3D Gaussians |
| (高密化) | | (楕円体数百万) |
+---------+ +-------------------+
| |
v v
[メッシュ .obj/.glb] [.ply / .splat / .ksplat]
| |
v v
[ポリゴン描画] [スプラット約10msラスタライズ]
左の枝が**フォトグラメトリ** — 写真からメッシュへ。1990年代の航空測量から始まり、RealityCapture・Metashape・Meshroomへと進化した。出力はポリゴン+テクスチャなので、ゲームエンジン・CAD・3Dプリンタにそのまま入る。
右の枝が**ガウシアン・スプラッティング** — 写真から3Dガウシアン楕円体へ。メッシュではなく、位置・共分散・色・不透明度を持つ**数百万の柔らかい点**が集まって場面を表す。髪・ガラス・煙のような、ポリゴンが表現に苦労した部分が自然に入ってくる。
覚えておく1行: **メッシュは触って切る3D、スプラットは見て回る3D。**
第2章 · 3DGSの仕組み — 楕円体アルファ合成
3Dガウシアン1つは次の5要素で定義される。
1. **位置(mean)** — 3次元座標 (x, y, z)。
2. **共分散(covariance)** — 3 by 3 行列。実際には回転クォータニオンとスケール・ベクトルに分解して学習する。
3. **不透明度(opacity)** — アルファ値。
4. **SH係数(spherical harmonics)** — 視点に依存する色をエンコードする球面調和係数。次数3まで使うと1ガウシアン当たり48値。
5. **視点依存色** — 上のSHからカメラ方向に合わせて合成された色。
レンダリングは次の順序だ。
1. すべてのガウシアンをカメラ空間へ投影
2. それぞれをスクリーン空間の2Dガウシアンへ圧縮(ヤコビアン近似)
3. 深度順に並べる(front-to-back)
4. 画素ごとにアルファ合成
NeRFが画素ごとに**数十〜数百サンプルを積分する(volumetric ray marching)** のに対し、3DGSは**事前ソート済みのガウシアンを一度に合成する**。これが100倍以上の速度差を生む。
学習はSfMが出した疎な点を初期値として、写真を再レンダリングしながら、ガウシアンの位置・共分散・SH・アルファをすべて微分可能に更新する。およそ30,000イテレーションで、写真100枚・1080pの結果が安定する。
第3章 · INRIAの参照実装 — 出発点
原論文の著者陣が公開したコード(`graphdeco-inria/gaussian-splatting`)は、今もすべての後続研究が比較するベースラインだ。CUDA 11.8以上、VRAM 12GB以上が推奨。
git clone https://github.com/graphdeco-inria/gaussian-splatting --recursive
cd gaussian-splatting
conda env create --file environment.yml
conda activate gaussian_splatting
COLMAPで写真をカメラ姿勢へ
python convert.py -s data/my_scene
学習(30k iter、V100/3090でおよそ30〜60分)
python train.py -s data/my_scene -m output/my_scene
ビューワ
./SIBR_viewers/install/bin/SIBR_gaussianViewer_app -m output/my_scene
長所: **参照実装**なので結果がきれい。短所: Windowsビルドが壊れやすく、学習オプションが少なく、ライセンスが**非商用(Non-commercial)**。商用案件は別の下流ツールへ移す必要がある。
第4章 · Nerfstudio 1.4 — 事実上の標準パイプライン
UC BerkeleyのKAIR Labが2022年に始めたNerfstudioは、2024年からNeRFというよりむしろ**3DGSの標準パイプライン**になった。2026年5月時点でバージョン1.4。
インストールは1行。
pip install nerfstudio
ns-install-cli
最短ワークフロー。
1. 写真や動画をカメラ姿勢に(COLMAPベース)
ns-process-data images --data /path/photos --output-dir /path/processed
2. 学習(Splatfacto = Nerfstudioの3DGS実装)
ns-train splatfacto --data /path/processed
3. 学習中にブラウザでビューワが自動起動
http://localhost:7007
4. .plyエクスポート
ns-export gaussian-splat --load-config outputs/.../config.yml --output-dir exports/
主な3つの変種。
- **Splatfacto** — 標準実装。INRIAのコードをPyTorchとgsplatの上に整理し直したもの。
- **Splatfacto-W** — 動く背景や人をマスクして学習する。街路・旅行写真に強い。Sarafianos et al., 2024。
- **Splatfacto-MCMC** — ガウシアン数を自動調整する。メモリ使用が均一。Kheradmand et al., 2024。
学習オプション。`ns-train splatfacto --max-num-iterations 30000 --pipeline.model.cull-alpha-thresh 0.005`。RTX 3090(24GB)で写真100枚・1080pがおよそ20分。
第5章 · gsplat — Nerfstudioチームのバックエンド
Nerfstudio 1.4が速い理由は、同じチームが別ライブラリ**gsplat**を作ったからだ。INRIAのCUDAカーネルを書き直し、次の機能を加えた。
- **アンチエイリアシング** — 3D smoothing filter、Mip-Splattingの統合。
- **MCMCサンプリング** — 学習中にガウシアン数を調整。
- **マルチGPU** — DDP学習をサポート。
- **速度** — INRIA比でおよそ4倍の学習速度、50%のメモリ。
自分のプロジェクトにもそのまま組み込める。
from gsplat import rasterization
means: (N, 3), quats: (N, 4), scales: (N, 3),
opacities: (N,), colors: (N, K, 3) Kは SH係数の数
renders, alphas, info = rasterization(
means=means,
quats=quats,
scales=scales,
opacities=opacities,
colors=colors,
viewmats=viewmats,
Ks=intrinsics,
width=W,
height=H,
render_mode='RGB',
)
このインターフェイスが標準となり、後続研究(SuGaR、2DGS、SpotlessSplatsなど)もほぼ全部がgsplatの上に乗る。
第6章 · Postshot 2.0 — Windows GUIの決定版
Jawsetの**Postshot**はWindows専用GUIだ。学生・アーティスト・VFXプロが最初に呼ぶ名前であり、2026年に2.0がリリースされた。
主な機能。
- **GUI一発** — フォルダをドロップしてTrainを押すだけ。
- **複数のプリセット** — Fast、Default、Quality。5分〜5時間。
- **モデル・ライブラリ** — INRIA、Splatfacto、MCMCをドロップダウンで選ぶ。
- **.ksplatエクスポート** — Antimatter15の圧縮フォーマット。Webへそのまま読み込み。
- **マスキングとセグメンテーション** — Segment Anything統合で前景・背景分離。
推奨スペック: RTX 3060(12GB)以上、Windows 10/11。12GB VRAMで安定して500〜600万ガウシアン。
ライセンス: 個人と教育は無料、商用は年USD 99のPostshot Plus。
[GUIワークフロー]
写真フォルダ -> Add Project
-> Tracking (COLMAP自動)
-> Train (Qualityプリセット、約60〜90分)
-> Refine (ガウシアンを整理・縮小)
-> Export -> .ksplat
第7章 · Luma AI Genie 2 — テキストと動画を3Dに
Luma AIは2022年にNeRF SDKでスタートし、2024年に**Genie**でテキスト・トゥ・3Dの戦線に加わった。2026年5月時点でGenie 2。
3つの入口。
1. **Capture(動画)** — iPhoneで360度回りながら30〜60秒撮影すると、クラウドで3DGSとNeRFを両方焼いてくれる。
2. **Genie 2(text-to-3D)** — 「1970s Volkswagen Beetle in studio light」のようなプロンプトでPBRテクスチャ付きメッシュ。およそ30秒〜2分。
3. **Interactive Scenes** — 1枚の写真や短い動画からカメラが自由に回るシーン。WebGL埋め込み対応。
Capture API。
動画をアップロード -> 3DGS .plyを受け取る
curl -X POST https://api.lumalabs.ai/dream-machine/v1/captures \
-H "Authorization: Bearer $LUMA_API_KEY" \
-F "title=My Capture" \
-F "media=@capture.mp4"
ライセンス: 個人は無料、Proは月USD 30、APIは従量課金。結果物の商用利用は可能だが、無料プランではLumaのブランド表示が義務。
第8章 · Polycam — モバイルがキャプチャ・デバイスになった瞬間
Polycamは2020年に、iPhone 12 ProのLiDARを本格活用した最初のモバイル・キャプチャ・アプリとして登場した。2026年には次の5つのキャプチャ・モードを揃える。
1. **LiDAR Mode** — iPhone/iPad ProのLiDARで直接メッシュ・キャプチャ。
2. **Photo Mode** — 写真だけでクラウド側フォトグラメトリ。
3. **Room Mode** — 室内の間取りを自動生成、USD/USDZエクスポート。
4. **Gaussian Splat Mode** — 動画を撮るとクラウドが.ply・.splatを学習。
5. **Capture API** — ドローンやDSLRなど外部カメラの結果をアップロードして学習。
PolycamのWebビューワは、SafariとChromeで100MB級の.splatを滑らかに回す。埋め込みはiframe1行で済む。
ライセンス: 無料プランは一部エクスポート制限あり。Proは月USD 17、Teamは年USD 1,200。韓国・日本の不動産・博物館・建設現場で急速に普及した。
代表事例: 日本の東海大学(Tokai University)建築学科がPolycam Room Modeでキャンパスのデジタル・ツインを2025年に作っている。
第9章 · Apple Object Capture と RealityKit — macOS 15 Sequoia API
Appleは2021年のWWDCで**Object Capture API**を発表した(macOS Monterey)。macOS 15 Sequoia(2024年)で洗練され、2026年のmacOS 26では**iPhone Photogrammetry**が端末上でメッシュを直接構築する。
最短のSwiftコード。
let inputFolder = URL(fileURLWithPath: "/path/photos")
let outputURL = URL(fileURLWithPath: "/path/model.usdz")
let session = try PhotogrammetrySession(input: inputFolder)
try session.process(requests: [
.modelFile(url: outputURL, detail: .full)
])
for try await output in session.outputs {
switch output {
case .processingComplete:
print("done")
case .requestProgress(_, let fraction):
print("\(fraction * 100)%")
default: break
}
}
要点。
- **USDZ直接出力** — AR Quick LookやVision Pro Immersive Scenesにそのまま入る。
- **詳細レベル** — preview、reduced、medium、full、raw。rawはおよそ1億面。
- **iPhone Photogrammetry(2026)** — ProとPro MaxでLiDAR+ARKit深度を組み合わせて精度向上。
- **APIのみ提供** — UIは提供されない。GitHubのサンプル(`HelloPhotogrammetry`)が補う。
ライセンス費用ゼロ。ハードウェア: M1以上のmacOS、iPhone 12 Pro以上を推奨。
第10章 · RealityCapture 1.5 — 産業級フォトグラメトリが無料に
プラハのCapturing Realityが作った**RealityCapture**は、長く産業の頂点だった。映画VFX・AAAゲームのアセット・文化財デジタル化の標準であり、マビノギ英雄伝、Black Myth: Wukong、ペトラ遺跡デジタル化などに使われた。
2021年にEpic Gamesが買収し、**2024年6月から完全無料化**された。2026年5月の1.5は次を追加した。
- **3DGS学習器の統合** — メッシュとスプラットを同じプロジェクトで。
- **航空LiDAR** — 航空レーザー測量と写真の整合。
- **AI Mesh Cleanup** — 自動デシメーションと穴埋め。
- **Unreal Engineへの直接エクスポート** — Nanite・MetaHuman互換。
推奨スペック: Windows 11、RTX 3080以上、32GB RAM。1000枚単位のプロジェクトが日常的。
ライセンス: **無料**だが、Epic Gamesアカウントが必須。メッシュ出力にウォーターマークなし。
第11章 · Scaniverse 4 — NianticのiPhone・Androidキャプチャ
Scaniverseは2020年にiOS LiDARキャプチャ・アプリとしてスタートし、2021年にNianticに買収された。2024年にAndroid版が出て、2026年の4は**Gaussian Splatモード**を中心に据えた。
特徴。
- **完全無料・無制限** — キャプチャもエクスポートも上限なし。
- **オンデバイス学習** — iPhone 14 Pro以上はクラウドに頼らず端末上で3DGSを学習。
- **GLB・USDZ・PLYエクスポート** — メッシュとスプラットの両方。
- **Niantic Lightship連携** — ARゲーム開発にそのまま使える。
キャプチャは1〜3分、学習は3〜10分。画質はPolycamやLumaと同等か若干劣るが、**ローカル+無料**の組み合わせが決定打。
第12章 · Meshroom 2024.x — AliceVisionのオープンソース陣営
オープンソース・フォトグラメトリで最も完成度が高いのが**AliceVision Meshroom**だ。2018年から開発が続いており、2024ビルド(GPL v3)はLinux・Windows・macOSすべてに対応。
特徴。
- **ノードベース・パイプライン** — Houdini・Nuke風のグラフGUI。
- **CUDA加速** — Dense MatchingとMeshingステージがGPUで動く。
- **3DGSノード**(2024ビルド) — メッシュ化後にガウシアン変換を同じグラフで。
最短ワークフロー。
CameraInit -> FeatureExtraction -> ImageMatching
-> FeatureMatching -> StructureFromMotion
-> PrepareDenseScene -> DepthMap -> DepthMapFilter
-> Meshing -> MeshFiltering -> Texturing
商用利用可、GPL v3。短所: GUIが重く、画質がRealityCaptureやMetashapeに比べて5〜10%劣る。
第13章 · 後続研究 — 2DGS · SuGaR · Mip-Splatting · SpotlessSplats
3DGSは2年で数百本の後続論文を生んだ。2026年5月時点で実際にツール化された5つだけまとめる。
- **2D Gaussian Splatting**(Huang et al., 2024) — 3D楕円体ではなく平面ディスク。表面抽出が正確で、メッシュ変換が自然。Nerfstudioに`splatfacto-2d`として入っている。
- **SuGaR**(Guédon et al., 2024) — スプラットからメッシュを取り出す後処理。ゲームエンジンとの互換性のためによく使う。
- **Mip-Splatting**(Yu et al., 2024) — 遠くのガウシアンのエイリアシングを軽減。ズームアウト・シーンで決定的。
- **SpotlessSplats**(Sabour et al., 2024) — 人や車などの一時的オブジェクトを自動的に無視。Splatfacto-Wの一般化。
- **Compact-3DGS**(Lee et al., 2024) — ガウシアン量子化とSH圧縮で.plyサイズを4〜10倍縮小。モバイル・Web配信に必須。
3つ全部を同時に当てた学習が、次のベースラインになる可能性が高い。
第14章 · エクスポート・フォーマット — .ply · .splat · .ksplat
3つのフォーマットが事実上の標準だ。
- **.ply**(Stanford PLY) — INRIA、Nerfstudio、gsplatの標準学習出力。非圧縮で数百MB。
- **.splat**(Antimatter15) — 1ガウシアン当たり32 bytesに量子化したバイナリ。同じシーンが.ply比5〜10倍小さい。
- **.ksplat**(Mark Kellogg) — .splatをさらに圧縮したフォーマット。SHを均一量子化し、ソート情報を事前に埋め込む。Web初回ロードが速い。
変換は通常こうなる。
Nerfstudioの.plyを.splatへ(Antimatter15のコンバータ)
git clone https://github.com/antimatter15/splat
node splat/convert.js outputs/.../point_cloud/iteration_30000/point_cloud.ply
.splatを.ksplatへ(Mark Kelloggのgaussian-splats-3d)
npm install -g @mkkellogg/gaussian-splats-3d
gaussian-splats-3d convert input.splat output.ksplat
サイズ比較。
| シーン | .ply | .splat | .ksplat |
|--------|------|--------|---------|
| リビング(100枚、1080p) | 380 MB | 52 MB | 28 MB |
| 小物(50枚、720p) | 110 MB | 15 MB | 8 MB |
| キャンパス(500枚、4K) | 1.4 GB | 230 MB | 140 MB |
第15章 · Webビューワ — Three.js · Babylon.js · Antimatter15
2026年のブラウザでガウシアン・スプラットを回す方法は次の3つ。
- **antimatter15/splat** — 2023年末の最初のWebGLビューワ。最も軽く、.splatをそのまま受け取る。
- **mkkellogg/gaussian-splats-3d** — Three.jsベース。カメラ・ライト・ポストプロセスと自然に組み合わさる。.ksplatが第一級。
- **Babylon.js 7.x・8** — 組み込みの`GaussianSplatting`メッシュ・クラス。WebGPU経路で最も安定。
Three.js + gaussian-splats-3dの最短例。
const viewer = new GaussianSplats3D.Viewer({
selfDrivenMode: true,
threeScene: new THREE.Scene(),
useWorkers: true,
})
await viewer.addSplatScene('/scenes/room.ksplat', {
splatAlphaRemovalThreshold: 5,
position: [0, 0, 0],
})
viewer.start()
WebGPU経路ではBabylon.js 8(2026年2月)が最速。iPhone 15で300万ガウシアン・60fps程度。
第16章 · キャプチャのベスト・プラクティス — 写真100枚の法則
3DGSとフォトグラメトリの結果の70%はキャプチャで決まる。5つの原則。
1. **重なり70%以上** — 隣接する写真同士がフレームの70%以上を共有しなければSfMが安定しない。
2. **3つの高さ** — 目線、膝、頭の上。同じ対象を上下から見たビューが必要。
3. **光は曇りの日** — 直射日光は影が硬くて学習が難しい。曇りの正午が理想。
4. **反射と透明面を避ける** — 鏡やガラスはSfMを壊す。部分的にマスキングが必要。
5. **動くオブジェクトは可能な限り除外** — 人や車が映り込んだらSpotlessSplatsかSplatfacto-Wでマスキング。
推奨枚数。小物50枚、1部屋100〜200枚、建物外観300〜500枚、キャンパス1,000枚以上。
撮影パターン。
小物 -> 360度の円周 + 上下の段(計3周)
部屋 -> 壁伝いに1周 + 天井1パス
建物 -> 外周4面 + 上空1枚(ドローン)
庭園 -> グリッド状に6〜10本の平行線
第17章 · 韓国・日本の導入事例
2024〜2025年に韓国・日本で目立った導入が次の5つ。
- **LG U+ ARグラス・コンテンツチーム** — Polycam Capture APIでソウル市内の名所を3DGSキャプチャし、ARガイド・コンテンツを制作(2024)。
- **国立中央博物館(韓国)** — RealityCapture + 自前学習パイプラインで青磁象嵌雲鶴文梅瓶のデジタル・ツインを作り、Web embedで公開(2025)。
- **POSCO・現代E&CのBIMチーム** — Polycam Room Mode + USDZエクスポートで現場進捗トラッキング。
- **東海大学(Tokai University・日本)** — Polycam Gaussian Splatでキャンパス全体をキャプチャし、新入生向け仮想ツアーを実装(2025)。
- **凸版印刷(Toppan Printing・日本)** — 文化財3DアーカイブをMetashapeからNerfstudioへ移行(2024)。結果は東海道新幹線の駅のデジタル・サイネージで配信。
共通点: **既存の写真や映像資産を新パイプラインで焼き直す**作業が、新規キャプチャより導入を加速させた点。
第18章 · Apple Vision Pro · Immersive Scenes · Reality Composer Pro 2.0
2024年のApple Vision Pro出荷後、2025年のvisionOS 2が**Immersive Scenes** APIを安定化させた。Reality Composer Pro 2.0(macOS 15 Sequoia)はUSDZを直接編集し、ガウシアン・スプラッティングを部分的にインポートする。
最短ワークフロー。
1. RealityCapture / Object Capture -> .usdzメッシュ
2. Reality Composer Pro 2.0でマテリアル・アンカーを編集
3. visionOS XcodeプロジェクトのRealityKitスコープに差し込み
4. ImmersiveSpaceで6DoF表示
3DGSのネイティブ・インポートはまだ未対応だが、Antimatter15のWebGLビューワをVision Pro Safariでそのまま動かすのが事実上の回避路。ネイティブ統合はvisionOS 3(2026年後半予想)で。
第19章 · ライセンス・マトリクス
| ツール | ライセンス | 商用利用 | ウォーターマーク |
|--------|------------|----------|----------------|
| INRIA gaussian-splatting | 非商用 | 不可 | - |
| Nerfstudio | Apache 2.0 | 可 | なし |
| gsplat | Apache 2.0 | 可 | なし |
| Postshot | 個人無料、年USD 99商用 | 可(有料) | なし |
| Luma AI Genie | 無料 / 月USD 30 Pro | 可 | 無料プランはLumaブランド |
| Polycam | 無料 / 月USD 17 Pro | 一部無料、エクスポート制限 | Proはなし |
| Apple Object Capture | Appleライセンス | 可 | なし |
| RealityCapture 1.5 | 無料(Epicアカウント) | 可 | なし |
| Scaniverse 4 | 無料 | 可 | なし |
| Meshroom | GPL v3 | 可(ソース開示条件) | なし |
商用案件の分岐。**学術ベースライン比較ならINRIA原本**、**自社サービスへの埋め込みならNerfstudio + gsplat**、**GUIで早く焼きたいなら有料Postshot**、**モバイル・現場ならPolycam ProかScaniverse**。
第20章 · 一枚で見る決定マトリクス
| シナリオ | 第1選択 | 第2選択 | 備考 |
|----------|---------|---------|------|
| iPhoneで素早くキャプチャ | Scaniverse 4 | Polycam | どちらもオンデバイス |
| 写真100枚・デスクトップ | Postshot 2.0 | Nerfstudio | GUI対CLI |
| 学術ベースライン | INRIA原本 | Nerfstudio | 非商用注意 |
| 自社サービスへ組み込み | Nerfstudio + .ksplat | Luma Capture API | ライセンスとコスト |
| AR Quick LookやVision Pro | Apple Object Capture | RealityCapture | USDZ直出力 |
| 映像VFX・ゲーム・アセット | RealityCapture 1.5 | Metashape | Unreal統合 |
| 文化財・博物館 | Metashape + Nerfstudio | RealityCapture | 精度 |
| テキストから即生成 | Luma Genie 2 | Meshy / Tripo | メッシュ出力 |
| オープンソース義務 | Meshroom + Nerfstudio | gsplat | GPL / Apache |
第21章 · これからの半年を一行で
3DGSの次の2四半期は3つに絞れる。
1. **Dynamic Gaussian Splatting** — 時間軸が加わった4Dスプラッティング。映像のなかでガウシアンが動く。2024年の4DGS論文が出発点。2026年にはNerfstudioにネイティブ統合が予定されている。
2. **AIアラインメント** — ガウシアンから意味(semantic)ラベルを自動抽出し、「この椅子だけ選んで」のような操作を可能にする。LangSplatとFeature 3DGSがこの前線。
3. **モバイル学習** — Scaniverse 4が最初の一歩を踏んだ。端末上学習が一般化すれば、クラウド・コスト・ゼロでキャプチャから視聴までが標準になる。
覚えておく1行: **2026年の3Dは「撮って触る3D」だ。** ポリゴンもテクスチャも知らない人が写真数枚で3Dを作り、そこにプロンプト1行でディテールを足す。3DGSはその最短の道。
第22章 · 次の一歩 — 1週間の学習プラン
この記事を読み終えたなら、次の7日間をこう使ってみると良い。
- **Day 1** — iPhoneでデスクの小物をScaniverse 4で撮ってみる。
- **Day 2** — 同じ写真をPolycam Photo Modeにアップロードして結果を比較。
- **Day 3** — デスクトップにPostshot 2.0を入れ、同じ素材を再学習する。
- **Day 4** — Nerfstudio 1.4を入れて`ns-train splatfacto`で同じデータを学習する。
- **Day 5** — 結果の.plyを.ksplatに変換し、Three.js + gaussian-splats-3dでWebに表示する。
- **Day 6** — RealityCapture 1.5で同じ写真をメッシュとして受け取り、2つの表現の違いを観る。
- **Day 7** — 自分の部屋を200枚撮り、本格的な最初のシーンを作る。
キャプチャはツールの操作ではなく、**目の訓練**だ。1週間で「このシーンを撮るとこう焼ける」という直感が身につく。
参考資料
- 3D Gaussian Splatting原論文 - https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/
- INRIA gaussian-splattingコード - https://github.com/graphdeco-inria/gaussian-splatting
- Nerfstudio公式 - https://docs.nerf.studio/
- Nerfstudio Splatfactoドキュメント - https://docs.nerf.studio/nerfology/methods/splat.html
- gsplatライブラリ - https://github.com/nerfstudio-project/gsplat
- Postshot (Jawset) - https://www.jawset.com/
- Luma AI - https://lumalabs.ai/
- Luma Genie - https://lumalabs.ai/genie
- Polycam - https://poly.cam/
- Apple Object Capture - https://developer.apple.com/augmented-reality/object-capture/
- Apple PhotogrammetrySession API - https://developer.apple.com/documentation/realitykit/photogrammetrysession
- RealityCapture - https://www.capturingreality.com/
- Scaniverse - https://scaniverse.com/
- AliceVision Meshroom - https://alicevision.org/
- 2D Gaussian Splatting論文 - https://surfsplatting.github.io/
- SuGaRプロジェクト - https://anttwo.github.io/sugar/
- Mip-Splatting - https://niujinshuchong.github.io/mip-splatting/
- SpotlessSplats - https://spotlesssplats.github.io/
- Antimatter15 splatビューワ - https://github.com/antimatter15/splat
- Mark Kellogg gaussian-splats-3d - https://github.com/mkkellogg/GaussianSplats3D
- Babylon.js Gaussian Splatting - https://doc.babylonjs.com/features/featuresDeepDive/mesh/gaussianSplatting
- Reality Composer Pro 2.0 - https://developer.apple.com/augmented-reality/tools/
- COLMAP - https://colmap.github.io/
- Hloc (Hierarchical Localization) - https://github.com/cvg/Hierarchical-Localization
현재 단락 (1/297)
2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)...