Skip to content

필사 모드: 3Dガウシアン・スプラッティングとフォトグラメトリ 2026 完全ガイド - Nerfstudio · Postshot · Luma Genie · Polycam · Apple Object Capture · RealityCapture 徹底解説

日本語
0%
정확도 0%
💡 왼쪽 원문을 읽으면서 오른쪽에 따라 써보세요. Tab 키로 힌트를 받을 수 있습니다.
원문 렌더가 준비되기 전까지 텍스트 가이드로 표시합니다.

プロローグ — ポリゴンの時代が終わりつつある風景

2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)であり、RealityCaptureとMetashapeがその頂点だった。

2023年7月、INRIAの一本の論文が風景を変えた。「3D Gaussian Splatting for Real-Time Radiance Field Rendering」 — Bernhard Kerbl、Georgios Kopanas、Thomas Leimkühler、George Drettakis。NeRFが1〜5分かかっていた1フレームが、**楕円体(ellipsoid)プリミティブ数百万個**のアルファ合成に置き換わり、同じ画質が**10ms以内**で出るようになった。

2026年5月の風景はこうだ。

- **Nerfstudio 1.4**が学習パイプラインの事実上の標準。Splatfacto、Splatfacto-W、Splatfacto-MCMCが1コマンドで走る。

- **Postshot 2.0**(Jawset)はWindows GUIで、12GBのVRAMから600万ガウシアンを焼く。`.ksplat`フォーマットがWebの事実上の標準になった。

- **Luma AI Genie 2**はテキスト1行で3Dメッシュやスプラットを出す。Interactive Scenesで仮想カメラが自由に回る。

- **Polycam**・**Scaniverse 4**・**Apple Object Capture**がモバイルとMacでキャプチャから学習までを面倒みる。

- **RealityCapture 1.5**は2024年6月からEpic Gamesの下で**完全無料**になった。メッシュとスプラットが同じツールに入っている。

本稿は2026年5月の3DGS・フォトグラメトリ・スタックを最初から最後まで整理する。キャプチャ → COLMAP・Hloc → 学習 → エクスポート → Webビューワ。その合間に、韓国・日本の実際の導入事例、学術ベースライン、ライセンスの落とし穴も挟む。

第1章 · 二つのパラダイム — メッシュとスプラット

まず一枚の図から。

[写真100枚]

|

v

[SfM: COLMAP / Hloc / Glomap]

|

+-> カメラ姿勢

+-> 疎な点群

|

v

+---------+ +-------------------+

| MVS | | 3D Gaussians |

| (高密化) | | (楕円体数百万) |

+---------+ +-------------------+

| |

v v

[メッシュ .obj/.glb] [.ply / .splat / .ksplat]

| |

v v

[ポリゴン描画] [スプラット約10msラスタライズ]

左の枝が**フォトグラメトリ** — 写真からメッシュへ。1990年代の航空測量から始まり、RealityCapture・Metashape・Meshroomへと進化した。出力はポリゴン+テクスチャなので、ゲームエンジン・CAD・3Dプリンタにそのまま入る。

右の枝が**ガウシアン・スプラッティング** — 写真から3Dガウシアン楕円体へ。メッシュではなく、位置・共分散・色・不透明度を持つ**数百万の柔らかい点**が集まって場面を表す。髪・ガラス・煙のような、ポリゴンが表現に苦労した部分が自然に入ってくる。

覚えておく1行: **メッシュは触って切る3D、スプラットは見て回る3D。**

第2章 · 3DGSの仕組み — 楕円体アルファ合成

3Dガウシアン1つは次の5要素で定義される。

1. **位置(mean)** — 3次元座標 (x, y, z)。

2. **共分散(covariance)** — 3 by 3 行列。実際には回転クォータニオンとスケール・ベクトルに分解して学習する。

3. **不透明度(opacity)** — アルファ値。

4. **SH係数(spherical harmonics)** — 視点に依存する色をエンコードする球面調和係数。次数3まで使うと1ガウシアン当たり48値。

5. **視点依存色** — 上のSHからカメラ方向に合わせて合成された色。

レンダリングは次の順序だ。

1. すべてのガウシアンをカメラ空間へ投影

2. それぞれをスクリーン空間の2Dガウシアンへ圧縮(ヤコビアン近似)

3. 深度順に並べる(front-to-back)

4. 画素ごとにアルファ合成

NeRFが画素ごとに**数十〜数百サンプルを積分する(volumetric ray marching)** のに対し、3DGSは**事前ソート済みのガウシアンを一度に合成する**。これが100倍以上の速度差を生む。

学習はSfMが出した疎な点を初期値として、写真を再レンダリングしながら、ガウシアンの位置・共分散・SH・アルファをすべて微分可能に更新する。およそ30,000イテレーションで、写真100枚・1080pの結果が安定する。

第3章 · INRIAの参照実装 — 出発点

原論文の著者陣が公開したコード(`graphdeco-inria/gaussian-splatting`)は、今もすべての後続研究が比較するベースラインだ。CUDA 11.8以上、VRAM 12GB以上が推奨。

git clone https://github.com/graphdeco-inria/gaussian-splatting --recursive

cd gaussian-splatting

conda env create --file environment.yml

conda activate gaussian_splatting

COLMAPで写真をカメラ姿勢へ

python convert.py -s data/my_scene

学習(30k iter、V100/3090でおよそ30〜60分)

python train.py -s data/my_scene -m output/my_scene

ビューワ

./SIBR_viewers/install/bin/SIBR_gaussianViewer_app -m output/my_scene

長所: **参照実装**なので結果がきれい。短所: Windowsビルドが壊れやすく、学習オプションが少なく、ライセンスが**非商用(Non-commercial)**。商用案件は別の下流ツールへ移す必要がある。

第4章 · Nerfstudio 1.4 — 事実上の標準パイプライン

UC BerkeleyのKAIR Labが2022年に始めたNerfstudioは、2024年からNeRFというよりむしろ**3DGSの標準パイプライン**になった。2026年5月時点でバージョン1.4。

インストールは1行。

pip install nerfstudio

ns-install-cli

最短ワークフロー。

1. 写真や動画をカメラ姿勢に(COLMAPベース)

ns-process-data images --data /path/photos --output-dir /path/processed

2. 学習(Splatfacto = Nerfstudioの3DGS実装)

ns-train splatfacto --data /path/processed

3. 学習中にブラウザでビューワが自動起動

http://localhost:7007

4. .plyエクスポート

ns-export gaussian-splat --load-config outputs/.../config.yml --output-dir exports/

主な3つの変種。

- **Splatfacto** — 標準実装。INRIAのコードをPyTorchとgsplatの上に整理し直したもの。

- **Splatfacto-W** — 動く背景や人をマスクして学習する。街路・旅行写真に強い。Sarafianos et al., 2024。

- **Splatfacto-MCMC** — ガウシアン数を自動調整する。メモリ使用が均一。Kheradmand et al., 2024。

学習オプション。`ns-train splatfacto --max-num-iterations 30000 --pipeline.model.cull-alpha-thresh 0.005`。RTX 3090(24GB)で写真100枚・1080pがおよそ20分。

第5章 · gsplat — Nerfstudioチームのバックエンド

Nerfstudio 1.4が速い理由は、同じチームが別ライブラリ**gsplat**を作ったからだ。INRIAのCUDAカーネルを書き直し、次の機能を加えた。

- **アンチエイリアシング** — 3D smoothing filter、Mip-Splattingの統合。

- **MCMCサンプリング** — 学習中にガウシアン数を調整。

- **マルチGPU** — DDP学習をサポート。

- **速度** — INRIA比でおよそ4倍の学習速度、50%のメモリ。

自分のプロジェクトにもそのまま組み込める。

from gsplat import rasterization

means: (N, 3), quats: (N, 4), scales: (N, 3),

opacities: (N,), colors: (N, K, 3) Kは SH係数の数

renders, alphas, info = rasterization(

means=means,

quats=quats,

scales=scales,

opacities=opacities,

colors=colors,

viewmats=viewmats,

Ks=intrinsics,

width=W,

height=H,

render_mode='RGB',

)

このインターフェイスが標準となり、後続研究(SuGaR、2DGS、SpotlessSplatsなど)もほぼ全部がgsplatの上に乗る。

第6章 · Postshot 2.0 — Windows GUIの決定版

Jawsetの**Postshot**はWindows専用GUIだ。学生・アーティスト・VFXプロが最初に呼ぶ名前であり、2026年に2.0がリリースされた。

主な機能。

- **GUI一発** — フォルダをドロップしてTrainを押すだけ。

- **複数のプリセット** — Fast、Default、Quality。5分〜5時間。

- **モデル・ライブラリ** — INRIA、Splatfacto、MCMCをドロップダウンで選ぶ。

- **.ksplatエクスポート** — Antimatter15の圧縮フォーマット。Webへそのまま読み込み。

- **マスキングとセグメンテーション** — Segment Anything統合で前景・背景分離。

推奨スペック: RTX 3060(12GB)以上、Windows 10/11。12GB VRAMで安定して500〜600万ガウシアン。

ライセンス: 個人と教育は無料、商用は年USD 99のPostshot Plus。

[GUIワークフロー]

写真フォルダ -> Add Project

-> Tracking (COLMAP自動)

-> Train (Qualityプリセット、約60〜90分)

-> Refine (ガウシアンを整理・縮小)

-> Export -> .ksplat

第7章 · Luma AI Genie 2 — テキストと動画を3Dに

Luma AIは2022年にNeRF SDKでスタートし、2024年に**Genie**でテキスト・トゥ・3Dの戦線に加わった。2026年5月時点でGenie 2。

3つの入口。

1. **Capture(動画)** — iPhoneで360度回りながら30〜60秒撮影すると、クラウドで3DGSとNeRFを両方焼いてくれる。

2. **Genie 2(text-to-3D)** — 「1970s Volkswagen Beetle in studio light」のようなプロンプトでPBRテクスチャ付きメッシュ。およそ30秒〜2分。

3. **Interactive Scenes** — 1枚の写真や短い動画からカメラが自由に回るシーン。WebGL埋め込み対応。

Capture API。

動画をアップロード -> 3DGS .plyを受け取る

curl -X POST https://api.lumalabs.ai/dream-machine/v1/captures \

-H "Authorization: Bearer $LUMA_API_KEY" \

-F "title=My Capture" \

-F "media=@capture.mp4"

ライセンス: 個人は無料、Proは月USD 30、APIは従量課金。結果物の商用利用は可能だが、無料プランではLumaのブランド表示が義務。

第8章 · Polycam — モバイルがキャプチャ・デバイスになった瞬間

Polycamは2020年に、iPhone 12 ProのLiDARを本格活用した最初のモバイル・キャプチャ・アプリとして登場した。2026年には次の5つのキャプチャ・モードを揃える。

1. **LiDAR Mode** — iPhone/iPad ProのLiDARで直接メッシュ・キャプチャ。

2. **Photo Mode** — 写真だけでクラウド側フォトグラメトリ。

3. **Room Mode** — 室内の間取りを自動生成、USD/USDZエクスポート。

4. **Gaussian Splat Mode** — 動画を撮るとクラウドが.ply・.splatを学習。

5. **Capture API** — ドローンやDSLRなど外部カメラの結果をアップロードして学習。

PolycamのWebビューワは、SafariとChromeで100MB級の.splatを滑らかに回す。埋め込みはiframe1行で済む。

ライセンス: 無料プランは一部エクスポート制限あり。Proは月USD 17、Teamは年USD 1,200。韓国・日本の不動産・博物館・建設現場で急速に普及した。

代表事例: 日本の東海大学(Tokai University)建築学科がPolycam Room Modeでキャンパスのデジタル・ツインを2025年に作っている。

第9章 · Apple Object Capture と RealityKit — macOS 15 Sequoia API

Appleは2021年のWWDCで**Object Capture API**を発表した(macOS Monterey)。macOS 15 Sequoia(2024年)で洗練され、2026年のmacOS 26では**iPhone Photogrammetry**が端末上でメッシュを直接構築する。

最短のSwiftコード。

let inputFolder = URL(fileURLWithPath: "/path/photos")

let outputURL = URL(fileURLWithPath: "/path/model.usdz")

let session = try PhotogrammetrySession(input: inputFolder)

try session.process(requests: [

.modelFile(url: outputURL, detail: .full)

])

for try await output in session.outputs {

switch output {

case .processingComplete:

print("done")

case .requestProgress(_, let fraction):

print("\(fraction * 100)%")

default: break

}

}

要点。

- **USDZ直接出力** — AR Quick LookやVision Pro Immersive Scenesにそのまま入る。

- **詳細レベル** — preview、reduced、medium、full、raw。rawはおよそ1億面。

- **iPhone Photogrammetry(2026)** — ProとPro MaxでLiDAR+ARKit深度を組み合わせて精度向上。

- **APIのみ提供** — UIは提供されない。GitHubのサンプル(`HelloPhotogrammetry`)が補う。

ライセンス費用ゼロ。ハードウェア: M1以上のmacOS、iPhone 12 Pro以上を推奨。

第10章 · RealityCapture 1.5 — 産業級フォトグラメトリが無料に

プラハのCapturing Realityが作った**RealityCapture**は、長く産業の頂点だった。映画VFX・AAAゲームのアセット・文化財デジタル化の標準であり、マビノギ英雄伝、Black Myth: Wukong、ペトラ遺跡デジタル化などに使われた。

2021年にEpic Gamesが買収し、**2024年6月から完全無料化**された。2026年5月の1.5は次を追加した。

- **3DGS学習器の統合** — メッシュとスプラットを同じプロジェクトで。

- **航空LiDAR** — 航空レーザー測量と写真の整合。

- **AI Mesh Cleanup** — 自動デシメーションと穴埋め。

- **Unreal Engineへの直接エクスポート** — Nanite・MetaHuman互換。

推奨スペック: Windows 11、RTX 3080以上、32GB RAM。1000枚単位のプロジェクトが日常的。

ライセンス: **無料**だが、Epic Gamesアカウントが必須。メッシュ出力にウォーターマークなし。

第11章 · Scaniverse 4 — NianticのiPhone・Androidキャプチャ

Scaniverseは2020年にiOS LiDARキャプチャ・アプリとしてスタートし、2021年にNianticに買収された。2024年にAndroid版が出て、2026年の4は**Gaussian Splatモード**を中心に据えた。

特徴。

- **完全無料・無制限** — キャプチャもエクスポートも上限なし。

- **オンデバイス学習** — iPhone 14 Pro以上はクラウドに頼らず端末上で3DGSを学習。

- **GLB・USDZ・PLYエクスポート** — メッシュとスプラットの両方。

- **Niantic Lightship連携** — ARゲーム開発にそのまま使える。

キャプチャは1〜3分、学習は3〜10分。画質はPolycamやLumaと同等か若干劣るが、**ローカル+無料**の組み合わせが決定打。

第12章 · Meshroom 2024.x — AliceVisionのオープンソース陣営

オープンソース・フォトグラメトリで最も完成度が高いのが**AliceVision Meshroom**だ。2018年から開発が続いており、2024ビルド(GPL v3)はLinux・Windows・macOSすべてに対応。

特徴。

- **ノードベース・パイプライン** — Houdini・Nuke風のグラフGUI。

- **CUDA加速** — Dense MatchingとMeshingステージがGPUで動く。

- **3DGSノード**(2024ビルド) — メッシュ化後にガウシアン変換を同じグラフで。

最短ワークフロー。

CameraInit -> FeatureExtraction -> ImageMatching

-> FeatureMatching -> StructureFromMotion

-> PrepareDenseScene -> DepthMap -> DepthMapFilter

-> Meshing -> MeshFiltering -> Texturing

商用利用可、GPL v3。短所: GUIが重く、画質がRealityCaptureやMetashapeに比べて5〜10%劣る。

第13章 · 後続研究 — 2DGS · SuGaR · Mip-Splatting · SpotlessSplats

3DGSは2年で数百本の後続論文を生んだ。2026年5月時点で実際にツール化された5つだけまとめる。

- **2D Gaussian Splatting**(Huang et al., 2024) — 3D楕円体ではなく平面ディスク。表面抽出が正確で、メッシュ変換が自然。Nerfstudioに`splatfacto-2d`として入っている。

- **SuGaR**(Guédon et al., 2024) — スプラットからメッシュを取り出す後処理。ゲームエンジンとの互換性のためによく使う。

- **Mip-Splatting**(Yu et al., 2024) — 遠くのガウシアンのエイリアシングを軽減。ズームアウト・シーンで決定的。

- **SpotlessSplats**(Sabour et al., 2024) — 人や車などの一時的オブジェクトを自動的に無視。Splatfacto-Wの一般化。

- **Compact-3DGS**(Lee et al., 2024) — ガウシアン量子化とSH圧縮で.plyサイズを4〜10倍縮小。モバイル・Web配信に必須。

3つ全部を同時に当てた学習が、次のベースラインになる可能性が高い。

第14章 · エクスポート・フォーマット — .ply · .splat · .ksplat

3つのフォーマットが事実上の標準だ。

- **.ply**(Stanford PLY) — INRIA、Nerfstudio、gsplatの標準学習出力。非圧縮で数百MB。

- **.splat**(Antimatter15) — 1ガウシアン当たり32 bytesに量子化したバイナリ。同じシーンが.ply比5〜10倍小さい。

- **.ksplat**(Mark Kellogg) — .splatをさらに圧縮したフォーマット。SHを均一量子化し、ソート情報を事前に埋め込む。Web初回ロードが速い。

変換は通常こうなる。

Nerfstudioの.plyを.splatへ(Antimatter15のコンバータ)

git clone https://github.com/antimatter15/splat

node splat/convert.js outputs/.../point_cloud/iteration_30000/point_cloud.ply

.splatを.ksplatへ(Mark Kelloggのgaussian-splats-3d)

npm install -g @mkkellogg/gaussian-splats-3d

gaussian-splats-3d convert input.splat output.ksplat

サイズ比較。

| シーン | .ply | .splat | .ksplat |

|--------|------|--------|---------|

| リビング(100枚、1080p) | 380 MB | 52 MB | 28 MB |

| 小物(50枚、720p) | 110 MB | 15 MB | 8 MB |

| キャンパス(500枚、4K) | 1.4 GB | 230 MB | 140 MB |

第15章 · Webビューワ — Three.js · Babylon.js · Antimatter15

2026年のブラウザでガウシアン・スプラットを回す方法は次の3つ。

- **antimatter15/splat** — 2023年末の最初のWebGLビューワ。最も軽く、.splatをそのまま受け取る。

- **mkkellogg/gaussian-splats-3d** — Three.jsベース。カメラ・ライト・ポストプロセスと自然に組み合わさる。.ksplatが第一級。

- **Babylon.js 7.x・8** — 組み込みの`GaussianSplatting`メッシュ・クラス。WebGPU経路で最も安定。

Three.js + gaussian-splats-3dの最短例。

const viewer = new GaussianSplats3D.Viewer({

selfDrivenMode: true,

threeScene: new THREE.Scene(),

useWorkers: true,

})

await viewer.addSplatScene('/scenes/room.ksplat', {

splatAlphaRemovalThreshold: 5,

position: [0, 0, 0],

})

viewer.start()

WebGPU経路ではBabylon.js 8(2026年2月)が最速。iPhone 15で300万ガウシアン・60fps程度。

第16章 · キャプチャのベスト・プラクティス — 写真100枚の法則

3DGSとフォトグラメトリの結果の70%はキャプチャで決まる。5つの原則。

1. **重なり70%以上** — 隣接する写真同士がフレームの70%以上を共有しなければSfMが安定しない。

2. **3つの高さ** — 目線、膝、頭の上。同じ対象を上下から見たビューが必要。

3. **光は曇りの日** — 直射日光は影が硬くて学習が難しい。曇りの正午が理想。

4. **反射と透明面を避ける** — 鏡やガラスはSfMを壊す。部分的にマスキングが必要。

5. **動くオブジェクトは可能な限り除外** — 人や車が映り込んだらSpotlessSplatsかSplatfacto-Wでマスキング。

推奨枚数。小物50枚、1部屋100〜200枚、建物外観300〜500枚、キャンパス1,000枚以上。

撮影パターン。

小物 -> 360度の円周 + 上下の段(計3周)

部屋 -> 壁伝いに1周 + 天井1パス

建物 -> 外周4面 + 上空1枚(ドローン)

庭園 -> グリッド状に6〜10本の平行線

第17章 · 韓国・日本の導入事例

2024〜2025年に韓国・日本で目立った導入が次の5つ。

- **LG U+ ARグラス・コンテンツチーム** — Polycam Capture APIでソウル市内の名所を3DGSキャプチャし、ARガイド・コンテンツを制作(2024)。

- **国立中央博物館(韓国)** — RealityCapture + 自前学習パイプラインで青磁象嵌雲鶴文梅瓶のデジタル・ツインを作り、Web embedで公開(2025)。

- **POSCO・現代E&CのBIMチーム** — Polycam Room Mode + USDZエクスポートで現場進捗トラッキング。

- **東海大学(Tokai University・日本)** — Polycam Gaussian Splatでキャンパス全体をキャプチャし、新入生向け仮想ツアーを実装(2025)。

- **凸版印刷(Toppan Printing・日本)** — 文化財3DアーカイブをMetashapeからNerfstudioへ移行(2024)。結果は東海道新幹線の駅のデジタル・サイネージで配信。

共通点: **既存の写真や映像資産を新パイプラインで焼き直す**作業が、新規キャプチャより導入を加速させた点。

第18章 · Apple Vision Pro · Immersive Scenes · Reality Composer Pro 2.0

2024年のApple Vision Pro出荷後、2025年のvisionOS 2が**Immersive Scenes** APIを安定化させた。Reality Composer Pro 2.0(macOS 15 Sequoia)はUSDZを直接編集し、ガウシアン・スプラッティングを部分的にインポートする。

最短ワークフロー。

1. RealityCapture / Object Capture -> .usdzメッシュ

2. Reality Composer Pro 2.0でマテリアル・アンカーを編集

3. visionOS XcodeプロジェクトのRealityKitスコープに差し込み

4. ImmersiveSpaceで6DoF表示

3DGSのネイティブ・インポートはまだ未対応だが、Antimatter15のWebGLビューワをVision Pro Safariでそのまま動かすのが事実上の回避路。ネイティブ統合はvisionOS 3(2026年後半予想)で。

第19章 · ライセンス・マトリクス

| ツール | ライセンス | 商用利用 | ウォーターマーク |

|--------|------------|----------|----------------|

| INRIA gaussian-splatting | 非商用 | 不可 | - |

| Nerfstudio | Apache 2.0 | 可 | なし |

| gsplat | Apache 2.0 | 可 | なし |

| Postshot | 個人無料、年USD 99商用 | 可(有料) | なし |

| Luma AI Genie | 無料 / 月USD 30 Pro | 可 | 無料プランはLumaブランド |

| Polycam | 無料 / 月USD 17 Pro | 一部無料、エクスポート制限 | Proはなし |

| Apple Object Capture | Appleライセンス | 可 | なし |

| RealityCapture 1.5 | 無料(Epicアカウント) | 可 | なし |

| Scaniverse 4 | 無料 | 可 | なし |

| Meshroom | GPL v3 | 可(ソース開示条件) | なし |

商用案件の分岐。**学術ベースライン比較ならINRIA原本**、**自社サービスへの埋め込みならNerfstudio + gsplat**、**GUIで早く焼きたいなら有料Postshot**、**モバイル・現場ならPolycam ProかScaniverse**。

第20章 · 一枚で見る決定マトリクス

| シナリオ | 第1選択 | 第2選択 | 備考 |

|----------|---------|---------|------|

| iPhoneで素早くキャプチャ | Scaniverse 4 | Polycam | どちらもオンデバイス |

| 写真100枚・デスクトップ | Postshot 2.0 | Nerfstudio | GUI対CLI |

| 学術ベースライン | INRIA原本 | Nerfstudio | 非商用注意 |

| 自社サービスへ組み込み | Nerfstudio + .ksplat | Luma Capture API | ライセンスとコスト |

| AR Quick LookやVision Pro | Apple Object Capture | RealityCapture | USDZ直出力 |

| 映像VFX・ゲーム・アセット | RealityCapture 1.5 | Metashape | Unreal統合 |

| 文化財・博物館 | Metashape + Nerfstudio | RealityCapture | 精度 |

| テキストから即生成 | Luma Genie 2 | Meshy / Tripo | メッシュ出力 |

| オープンソース義務 | Meshroom + Nerfstudio | gsplat | GPL / Apache |

第21章 · これからの半年を一行で

3DGSの次の2四半期は3つに絞れる。

1. **Dynamic Gaussian Splatting** — 時間軸が加わった4Dスプラッティング。映像のなかでガウシアンが動く。2024年の4DGS論文が出発点。2026年にはNerfstudioにネイティブ統合が予定されている。

2. **AIアラインメント** — ガウシアンから意味(semantic)ラベルを自動抽出し、「この椅子だけ選んで」のような操作を可能にする。LangSplatとFeature 3DGSがこの前線。

3. **モバイル学習** — Scaniverse 4が最初の一歩を踏んだ。端末上学習が一般化すれば、クラウド・コスト・ゼロでキャプチャから視聴までが標準になる。

覚えておく1行: **2026年の3Dは「撮って触る3D」だ。** ポリゴンもテクスチャも知らない人が写真数枚で3Dを作り、そこにプロンプト1行でディテールを足す。3DGSはその最短の道。

第22章 · 次の一歩 — 1週間の学習プラン

この記事を読み終えたなら、次の7日間をこう使ってみると良い。

- **Day 1** — iPhoneでデスクの小物をScaniverse 4で撮ってみる。

- **Day 2** — 同じ写真をPolycam Photo Modeにアップロードして結果を比較。

- **Day 3** — デスクトップにPostshot 2.0を入れ、同じ素材を再学習する。

- **Day 4** — Nerfstudio 1.4を入れて`ns-train splatfacto`で同じデータを学習する。

- **Day 5** — 結果の.plyを.ksplatに変換し、Three.js + gaussian-splats-3dでWebに表示する。

- **Day 6** — RealityCapture 1.5で同じ写真をメッシュとして受け取り、2つの表現の違いを観る。

- **Day 7** — 自分の部屋を200枚撮り、本格的な最初のシーンを作る。

キャプチャはツールの操作ではなく、**目の訓練**だ。1週間で「このシーンを撮るとこう焼ける」という直感が身につく。

参考資料

- 3D Gaussian Splatting原論文 - https://repo-sam.inria.fr/fungraph/3d-gaussian-splatting/

- INRIA gaussian-splattingコード - https://github.com/graphdeco-inria/gaussian-splatting

- Nerfstudio公式 - https://docs.nerf.studio/

- Nerfstudio Splatfactoドキュメント - https://docs.nerf.studio/nerfology/methods/splat.html

- gsplatライブラリ - https://github.com/nerfstudio-project/gsplat

- Postshot (Jawset) - https://www.jawset.com/

- Luma AI - https://lumalabs.ai/

- Luma Genie - https://lumalabs.ai/genie

- Polycam - https://poly.cam/

- Apple Object Capture - https://developer.apple.com/augmented-reality/object-capture/

- Apple PhotogrammetrySession API - https://developer.apple.com/documentation/realitykit/photogrammetrysession

- RealityCapture - https://www.capturingreality.com/

- Scaniverse - https://scaniverse.com/

- AliceVision Meshroom - https://alicevision.org/

- 2D Gaussian Splatting論文 - https://surfsplatting.github.io/

- SuGaRプロジェクト - https://anttwo.github.io/sugar/

- Mip-Splatting - https://niujinshuchong.github.io/mip-splatting/

- SpotlessSplats - https://spotlesssplats.github.io/

- Antimatter15 splatビューワ - https://github.com/antimatter15/splat

- Mark Kellogg gaussian-splats-3d - https://github.com/mkkellogg/GaussianSplats3D

- Babylon.js Gaussian Splatting - https://doc.babylonjs.com/features/featuresDeepDive/mesh/gaussianSplatting

- Reality Composer Pro 2.0 - https://developer.apple.com/augmented-reality/tools/

- COLMAP - https://colmap.github.io/

- Hloc (Hierarchical Localization) - https://github.com/cvg/Hierarchical-Localization

현재 단락 (1/297)

2010年代まで、3Dとはポリゴンメッシュのことだった。頂点・面・UV・テクスチャ。Blender・Maya・ZBrush。写真をメッシュに変える仕事はフォトグラメトリ(photogrammetry)...

작성 글자: 0원문 글자: 14,915작성 단락: 0/297