마스크 전처리 방식(Java)
업데이트: 2022/12/08
Live2D Cubism SDK for Java에서는 스마트폰 등에서 그리기 속도를 유지하기 위해,
모델 묘화 처리의 최초로 1매의 마스크 버퍼에 대해서 모든 마스크 형상을 묘화하는 「전처리 방식」을 채용하고 있습니다.
원칙적인 드로잉 방법은 마스크가 필요한 Drawable을 그릴 때마다 마스크 모양을 그립니다(그림 참조).
이 방법에서는 Drawable이 마스크를 필요로 할 때마다 렌더 타깃의 전환·버퍼의 클리어 등 비교적 고비용의 처리가 발생하게 됩니다.
따라서 스마트폰 등에서 그리기 속도가 저하되는 원인이 될 수 있습니다.
그러나 미리 마스크를 준비하는 것만으로는 마스크 버퍼가 여러 장 필요하게 되어, 메모리를 압박하게 됩니다.
이 점을 해결하기 위해 1장의 마스크 버퍼에 대해서 이하의 처리를 실시함으로써, 마치 여러 장의 마스크 버퍼를 이용하고 있는 것처럼 취급하면서 메모리의 압박을 억제할 수 있습니다.
마스크 통합
미리 모든 마스크를 생성하기 때문에 동일한 마스크 지정을 받은 Drawable은 동일한 마스크 이미지를 사용하여 생성하는 매수를 줄일 수 있습니다.
이 처리는 CubismRendererAndroid.initialize 함수 호출 중에서 CubismClippingManagerAndroid.initialize 함수에 의해 수행됩니다.
void initialize( int drawableCount, final int[][] drawableMasks, final int[] drawableMaskCounts ) { // 클리핑 마스크를 사용하는 모든 그리기 오브젝트를 등록 // 클리핑 마스크는 일반적으로 몇 개 정도로 한정하여 사용한다 for (int i = 0; i < drawableCount; i++) { if (drawableMaskCounts[i] <= 0) { // 클리핑 마스크를 사용하지 않은 아트메쉬(대부분의 경우 사용하지 않음) _clippingContextListForDraw.add(null); continue; } // 이미 있는 ClipContext와 같은지 확인 CubismClippingContext cc = findSameClip(drawableMasks[i], drawableMaskCounts[i]); if (cc == null) { // 동일한 마스크가 존재하지 않으면 생성 cc = new CubismClippingContext(this, drawableMasks[i], drawableMaskCounts[i]); _clippingContextListForMask.add(cc); } cc.addClippedDrawable(i); _clippingContextListForDraw.add(cc); } }
여러 장의 마스크용 텍스쳐 사용
Cubism SDK for Java R1 beta1 이상에서는 마스크용 텍스쳐를 임의로 여러 장 사용할 수 있습니다.
이로 인해 alpha1까지 존재한 마스크의 사용 상한수인 36장을 초과하는 마스크를 모델로 설정해도 SDK상에서 정상적으로 표시할 수 있게 됩니다.
단, 마스크용 텍스쳐를 2장 이상 사용했을 경우 마스크용 텍스쳐 1장에 대해 생성되는 마스크의 상한수는 32장까지입니다.
(1장만 사용하는 경우의 마스크 상한수는 36장입니다. 이에 대한 자세한 내용은 후술합니다)
만약 마스크용 텍스쳐를 2장 사용했을 경우 사용할 수 있는 마스크의 상한수는 32*2인 64장이 됩니다.
마스크용 텍스쳐를 여러 장 사용하기 위한 설정은 다음과 같습니다.
1234 | int maskBufferCount = 2;CubismRenderer renderer = CubismRendererAndroid.create();renderer.initialize(cubismModel, maskBufferCount); |
CubismRendererAndroid.initialize()의 제2인수에 아무것도 전달하지 않을 경우 마스크용 텍스쳐는 1장만 생성, 사용됩니다.
1 | renderer.initialize(cubismModel); |
색상 정보로 분리
마스크 버퍼는 실태로서 통상의 텍스쳐 버퍼 등과 마찬가지로 RGBA의 영상용 배열입니다.
일반 마스크 처리에서는 이 A 채널만을 사용하여 마스크를 적용하지만 RGB 채널은 사용하지 않습니다.
따라서 RGBA에서 별개의 마스크 데이터를 가짐으로써 1매의 마스크 버퍼를 4장의 마스크 버퍼로서 취급할 수 있게 됩니다.
분할 분리
마스크 이미지가 4장으로는 부족해졌을 때 마스크 버퍼를 2분할, 4분할, 9분할로 취급함으로써 마스크의 매수를 늘립니다.
색 정보에 의한 분할도 있으므로 4×9의 36장까지 다른 마스크를 유지할 수 있게 되어 있습니다.
또한 마스크 이미지가 깨지는 것을 방지하기 위해 마스크 적용을 받는 모든 Drawable 직사각형으로 마스크를 그립니다.
이 때문에 범위의 생성과 마스크 생성, 마스크 사용으로 매트릭스의 생성이 필요하게 됩니다.
마스크용 텍스쳐를 여러 장 이용하는 경우도 분할 방식은 마스크용 텍스쳐 1장만을 이용한 경우와 동일합니다.
단, 마스크용 텍스쳐를 여러 장 이용하는 경우에는 마스크용 텍스쳐 1장에 대한 마스크의 할당을 가능한 한 등분하게 되기 때문에, 같은 모델에서도 그리기 품질이 향상됩니다. (마스크용 텍스쳐를 늘리면 그만큼 비용이 듭니다)
예를 들면, 마스크가 32장의 모델인 경우 일반적으로는 마스크용 텍스쳐 1장으로 32장의 마스크를 그리려고 하지만, 마스크용 텍스쳐를 2장 사용했을 경우의 마스크 할당은 「1장당 16장」이 됩니다.
직사각형 확인
마스크 생성의 첫 번째 단계에서 마스크별로 마스크 적용 대상이 모두 들어가는 직사각형을 확인합니다.
private void calcClippedDrawTotalBounds(CubismModel model, CubismClippingContext clippingContext) { // 피 클리핑 마스크(마스킹되는 그리기 오브젝트)의 전체 직사각형 float clippedDrawTotalMinX = Float.MAX_VALUE; float clippedDrawTotalMinY = Float.MAX_VALUE; float clippedDrawTotalMaxX = -Float.MAX_VALUE; float clippedDrawTotalMaxY = -Float.MAX_VALUE; // 이 마스크가 실제로 필요한지 판정한다 // 이 클리핑을 이용하는 「그리기 오브젝트」가 하나라도 사용 가능하면 마스크를 생성할 필요가 있다 final int clippedDrawCount = clippingContext.getClippedDrawableIndexList().size(); for (int clippedDrawableIndex = 0; clippedDrawableIndex < clippedDrawCount; clippedDrawableIndex++) { // 마스크를 사용하는 그리기 오브젝트가 그려지는 직사각형을 구한다 final int drawableIndex = clippingContext.getClippedDrawableIndexList().get(clippedDrawableIndex); final int drawableVertexCount = model.getDrawableVertexCount(drawableIndex); float[] drawableVertices = model.getDrawableVertices(drawableIndex); float minX = Float.MAX_VALUE; float minY = Float.MAX_VALUE; float maxX = -Float.MAX_VALUE; float maxY = -Float.MAX_VALUE; int loop = drawableVertexCount * VERTEX_STEP; for (int pi = VERTEX_OFFSET; pi < loop; pi += VERTEX_STEP) { float x = drawableVertices[pi]; float y = drawableVertices[pi + 1]; if (x < minX) minX = x; if (x > maxX) maxX = x; if (y < minY) minY = y; if (y > maxY) maxY = y; } //유효한 점이 하나도 잡히지 않았기 때문에 건너뛴다 if (minX == Float.MAX_VALUE) { continue; } // 전체 직사각형에 반영 if (minX < clippedDrawTotalMinX) clippedDrawTotalMinX = minX; if (maxX > clippedDrawTotalMaxX) clippedDrawTotalMaxX = maxX; if (minY < clippedDrawTotalMinY) clippedDrawTotalMinY = minY; if (maxY > clippedDrawTotalMaxY) clippedDrawTotalMaxY = maxY; } if (clippedDrawTotalMinX == Float.MAX_VALUE) { clippingContext.setUsing(false); CubismRectangle clippedDrawRect = clippingContext.getAllClippedDrawRect(); clippedDrawRect.setX(0.0f); clippedDrawRect.setY(0.0f); clippedDrawRect.setWidth(0.0f); clippedDrawRect.setHeight(0.0f); } else { clippingContext.setUsing(true); float w = clippedDrawTotalMaxX - clippedDrawTotalMinX; float h = clippedDrawTotalMaxY - clippedDrawTotalMinY; CubismRectangle clippedDrawRect = clippingContext.getAllClippedDrawRect(); clippedDrawRect.setX(clippedDrawTotalMinX); clippedDrawRect.setY(clippedDrawTotalMinY); clippedDrawRect.setWidth(w); clippedDrawRect.setHeight(h); } }
색 분리, 분할 분리를 받은 레이아웃 결정
마스크마다 소속되는 마스크 버퍼의 색 채널, 분할 위치를 정합니다.
private void setupLayoutBounds(int usingClipCount) { // 하나의 RenderTexture를 최대한 많이 사용하여 마스크를 레이아웃 // 마스크 그룹 수가 4 이하라면 RGBA 각 채널에 하나씩 마스크를 배치하고, 5 이상 6 이하라면 RGBA를 2,2,1,1로 배치한다 // RGBA를 차례로 사용한다 final int div = usingClipCount / COLOR_CHANNEL_COUNT; // 1채널이 배치하는 기본 마스크 개수 final int mod = usingClipCount % COLOR_CHANNEL_COUNT; //나머지는 이 번호의 채널까지 하나씩 할당 // RGBA 각각의 채널을 준비해 간다(0:R, 1:G, 2:B, 3:A) int curClipIndex = 0; //순서대로 설정 for (int channelNo = 0; channelNo < COLOR_CHANNEL_COUNT; channelNo++) { // 이 채널에 배치할 수 final int layoutCount = div + (channelNo < mod ? 1 : 0); // 분할 방법 결정 if (layoutCount == 0) { // 아무것도 하지 않는다 } else if (layoutCount == 1) { // 모두 그대로 사용 CubismClippingContext cc = _clippingContextListForMask.get(curClipIndex++); cc.setLayoutChannelNo(channelNo); CubismRectangle bounds = cc.getLayoutBounds(); bounds.setX(0.0f); bounds.setY(0.0f); bounds.setWidth(1.0f); bounds.setHeight(1.0f); } else if (layoutCount == 2) { for (int i = 0; i < layoutCount; i++) { final int xpos = i % 2; CubismClippingContext cc = _clippingContextListForMask.get(curClipIndex++); cc.setLayoutChannelNo(channelNo); CubismRectangle bounds = cc.getLayoutBounds(); bounds.setX(xpos * 0.5f); bounds.setY(0.0f); bounds.setWidth(0.5f); bounds.setHeight(1.0f); // UV를 2개로 분해하여 사용 } } else if (layoutCount <= 4) { // 4분할하여 사용 for (int i = 0; i < layoutCount; i++) { final int xpos = i % 2; final int ypos = i / 2; CubismClippingContext cc = _clippingContextListForMask.get(curClipIndex++); cc.setLayoutChannelNo(channelNo); CubismRectangle bounds = cc.getLayoutBounds(); bounds.setX(xpos * 0.5f); bounds.setY(ypos * 0.5f); bounds.setWidth(0.5f); bounds.setHeight(0.5f); } } else if (layoutCount <= 9) { // 9분할하여 사용 for (int i = 0; i < layoutCount; i++) { final int xpos = i % 3; final int ypos = i / 3; CubismClippingContext cc = _clippingContextListForMask.get(curClipIndex++); cc.setLayoutChannelNo(channelNo); CubismRectangle bounds = cc.getLayoutBounds(); bounds.setX(xpos / 3.0f); bounds.setY(ypos / 3.0f); bounds.setWidth(1.0f / 3.0f); bounds.setHeight(1.0f / 3.0f); } } else { cubismLogError("not supported mask count : " + layoutCount); // 개발자 모드라면 프로그램을 정지시킨다. assert false; // 만약 실행을 계속하면 setupShaderProgram() 메소드는 오버 액세스를 일으킨다. 따라서 어쩔 수 없이 적절하게 넣어 둔다. // 당연히 그리기 결과는 어색해진다. for (int i = 0; i < layoutCount; i++) { CubismClippingContext cc = _clippingContextListForMask.get(curClipIndex++); cc.setLayoutChannelNo(0); CubismRectangle bounds = cc.getLayoutBounds(); bounds.setX(0.0f); bounds.setY(0.0f); bounds.setWidth(1.0f); bounds.setHeight(1.0f); } } } }
마스크 그리기, 마스크 사용의 매트릭스 생성
그리기 전에 조사한 직사각형 범위와 소속 장소에 근거해 마스크 생성용, 마스크 사용용 변환 매트릭스를 준비합니다.
/*생략*/ // --- 실제로 하나의 마스크를 그리기 --- for (CubismClippingContext clipContext : _clippingContextListForMask) { CubismRectangle allClippedDrawRect = clipContext.getAllClippedDrawRect(); CubismRectangle layoutBoundsOnTex01 = clipContext.getLayoutBounds(); // 모델 좌표상의 직사각형을, 적절히 마진을 붙여 사용한다 CubismRectangle tmpBoundsOnModel = CubismRectangle.create(allClippedDrawRect); final float margin = 0.05f; tmpBoundsOnModel.expand( allClippedDrawRect.getWidth() * margin, allClippedDrawRect.getHeight() * margin ); // ######## 본래는 할당된 영역 전체를 사용하지 않고 필요 최소한의 크기가 좋다 // 셰이더용 계산식을 구한다. 회전을 고려하지 않는 경우는 다음과 같음 // movePeriod' = movePeriod * scaleX + offX [[movePeriod' = (movePeriod' - tmpBoundsOnModel.movePeriod) * scale + layoutBoundsOnT final float scaleX = layoutBoundsOnTex01.getWidth() / tmpBoundsOnModel.getWidth(); final float scaleY = layoutBoundsOnTex01.getHeight() / tmpBoundsOnModel.getHeight(); // 마스크를 생성할 때 사용할 행렬을 구한다 CubismMatrix44 tmpMatrix = CubismMatrix44.create(); // 셰이더에 전달하는 행렬을 구한다 <<<<<<<<<< 최적화 필요(역순으로 계산하면 간단하게 할 수 있음) // Layout0..1을 -1..1로 변환 tmpMatrix.translateRelative(-1.0f, -1.0f); tmpMatrix.scaleRelative(2.0f, 2.0f); // view to Layout0..1 tmpMatrix.translateRelative( layoutBoundsOnTex01.getX(), layoutBoundsOnTex01.getY() ); tmpMatrix.scaleRelative(scaleX, scaleY); tmpMatrix.translateRelative( -tmpBoundsOnModel.getX(), -tmpBoundsOnModel.getY() ); clipContext.getMatrixForDraw().setMatrix(tmpMatrix); /*생략*/ }
마스크 버퍼의 동적 크기 변경
OpenGL ES 2.0 렌더러는 실행 시에 마스크 버퍼의 크기를 변경하는 API를 제공합니다.
현재 마스크 버퍼의 사이즈는 초기값으로 256*256(픽셀)을 설정하고 있는데 마스크 생성 영역을 9매로 자르는 경우 85*85(픽셀)의 직사각형 영역에 묘화한 마스크 형상을 한층 더 확대해 클리핑 영역으로서 사용합니다.
그 결과 클리핑 결과의 가장자리가 흐리거나 번지는 현상이 나타납니다.
이를 해결하는 방법으로 마스크 버퍼의 크기를 프로그램 실행 시에 변경하는 API를 제공합니다.
예를 들어, 마스크 버퍼의 크기를 256*256 ⇒ 1024*1024로 함으로써 마스크 생성 영역을 9매로 자르는 경우 341*341의 직사각형 영역에 마스크 형상을 그릴 수 있으므로, 클리핑 영역으로 확대하여 사용해도 클리핑 결과의 가장자리의 흐림이나 번짐을 없앨 수 있습니다.
※마스크 버퍼의 사이즈를 크게 한다 ⇒ 처리하는 픽셀이 증가하면 속도는 느려지지만, 묘화 결과는 깨끗해진다.
※마스크 버퍼의 사이즈를 작게 한다 ⇒ 처리하는 픽셀이 줄어들기 때문에 속도는 빨라지지만, 묘화 결과는 더러워진다.
public void setClippingMaskBufferSize(final float width, final float height) { // FrameBuffer의 크기를 변경하기 위해 인스턴스를 재생성한다. _clippingManager = new CubismClippingManagerAndroid(); _clippingManager.setClippingMaskBufferSize(width, height); CubismModel model = getModel(); _clippingManager.initialize( model.getDrawableCount(), model.getDrawableMasks(), model.getDrawableMaskCounts() ); }
전처리 방식으로 성능 향상을 기대할 수 있는 이유
휴대 단말기 특유의 사정으로 GPU에 대한 Clear 명령이나 렌더링 타깃 전환 명령의 처리 비용이 다른 명령보다 높을 수 있습니다.
원칙적인 방식으로 그릴 때는 이러한 처리 비용이 높은 명령을 마스크가 필요한 Drawable의 수만큼 실행하게 됩니다.
그러나 전처리 방식의 경우에는 이러한 명령을 실행하는 횟수를 줄일 수 있으므로 스마트폰 등에서의 성능 향상을 기대할 수 있습니다.
실제로 그 효과를 파악하기 위한 실험을 실시하고 있습니다.
이 실험의 측정 방법과 결과에 대해서는 「(Native)마스크 전처리 방식」의 「전처리 방식으로 성능 향상을 기대할 수 있는 이유」를 봐 주세요.
마스크 처리를 고선명 방식으로 전환
그릴 때마다 마스크를 생성하는 방법이라면 낮은 사양 단말기에서는 성능에 영향이 있습니다.
그러나 최종적으로 동영상으로서 출력하는 경우와 같이, 런타임에서의 퍼포먼스보다 화면의 품질을 중시하는 경우는 이쪽 방식이 더 적합합니다.
Cubism SDK for Java에서는 마스크 처리를 고선명 방식으로 전환할 수 있습니다.
고선명 방식으로 전환하려면 다음 API에 true를 전달합니다.
CubismRenderer.isUsingHighPrecisionMask()