마스크 전처리 방식(Native)
업데이트: 2024/01/18
Cubism 5 SDK 이상에서는 일부 클래스 이름 등이 변경되었습니다.
자세한 내용은 CHANGELOG를 참조하십시오.
Live2D Cubism SDK for Native에서는 스마트폰 등에서 그리기 속도를 유지하기 위해,
모델 묘화 처리의 최초로 1매의 마스크 버퍼에 대해서 모든 마스크 형상을 묘화하는 「전처리 방식」을 채용하고 있습니다.
원칙적인 드로잉 방법은 마스크가 필요한 Drawable을 그릴 때마다 마스크 모양을 그립니다(그림 참조).
이 방법에서는 Drawable이 마스크를 필요로 할 때마다 렌더 타깃의 전환·버퍼의 클리어 등 비교적 고비용의 처리가 발생하게 됩니다.
따라서 스마트폰 등에서 그리기 속도가 저하되는 원인이 될 수 있습니다.
그러나 미리 마스크를 준비하는 것만으로는 마스크 버퍼가 여러 장 필요하게 되어, 메모리를 압박하게 됩니다.
이 점을 해결하기 위해 1장의 마스크 버퍼에 대해서 이하의 처리를 실시함으로써, 마치 여러 장의 마스크 버퍼를 이용하고 있는 것처럼 취급하면서 메모리의 압박을 억제할 수 있습니다.
마스크 통합
미리 모든 마스크를 생성하기 때문에 동일한 마스크 지정을 받은 Drawable은 동일한 마스크 이미지를 사용하여 생성하는 매수를 줄일 수 있습니다.
이 처리는 CubismRenderer_OpenGLES2::Initialize 함수 호출 중에서
CubismClippingManager::Initialize 함수에 의해 수행됩니다.
template <class T_ClippingContext, class T_OffscreenSurface> void CubismClippingManager<T_ClippingContext, T_OffscreenSurface>::Initialize(CubismModel& model, const csmInt32 maskBufferCount) { _renderTextureCount = maskBufferCount; // 렌더 텍스쳐의 클리어 플래그 설정 for (csmInt32 i = 0; i < _renderTextureCount; ++i) { _clearedMaskBufferFlags.PushBack(false); } // 클리핑 마스크를 사용하는 모든 그리기 오브젝트를 등록 // 클리핑 마스크는 일반적으로 몇 개 정도로 한정하여 사용 for (csmInt32 i = 0; i < model.GetDrawableCount(); i++) { if (model.GetDrawableMaskCounts()[i] <= 0) { // 클리핑 마스크를 사용하지 않은 아트메쉬(대부분의 경우 사용하지 않음) _clippingContextListForDraw.PushBack(NULL); continue; } // 이미 있는 ClipContext와 같은지 확인 T_ClippingContext* cc = FindSameClip(model.GetDrawableMasks()[i], model.GetDrawableMaskCounts()[i]); if (cc == NULL) { // 동일한 마스크가 존재하지 않으면 생성 cc = CSM_NEW T_ClippingContext(this, model, model.GetDrawableMasks()[i], model.GetDrawableMaskCounts()[i]); _clippingContextListForMask.PushBack(cc); } cc->AddClippedDrawable(i); _clippingContextListForDraw.PushBack(cc); } }
여러 장의 마스크용 텍스쳐 사용
Cubism SDK for Native R6 이상에서는 마스크용 텍스쳐를 임의로 여러 장 사용할 수 있습니다.
이로 인해 R5까지 존재한 마스크의 사용 상한수인 36장을 초과하는 마스크를 모델로 설정해도 SDK상에서 정상적으로 표시할 수 있게 됩니다.
단, 마스크용 텍스쳐를 2장 이상 사용했을 경우 마스크용 텍스쳐 1장에 대해 생성되는 마스크의 상한수는 32장까지입니다.
(1장만 사용하는 경우의 마스크 상한수는 36장입니다. 이에 대한 자세한 내용은 후술합니다)
만약 마스크용 텍스쳐를 2장 사용했을 경우 사용할 수 있는 마스크의 상한수는 32*2인 64장이 됩니다.
마스크용 텍스쳐를 여러 장 사용하기 위한 설정은 다음과 같습니다.
void CreateRenderer(csmInt32 maskBufferCount = 2);
색상 정보로 분리
마스크 버퍼는 실체로서 통상의 텍스쳐 버퍼 등과 마찬가지로 RGBA의 영상용 배열입니다.
일반 마스크 처리에서는 이 A 채널만을 사용하여 마스크를 적용하지만 RGB 채널은 사용하지 않습니다.
따라서 RGBA에서 별개의 마스크 데이터를 가짐으로써 1매의 마스크 버퍼를 4장의 마스크 버퍼로서 취급할 수 있게 됩니다.
분할 분리
마스크 이미지가 4장으로는 부족해졌을 때 마스크 버퍼를 2분할, 4분할, 9분할로 취급함으로써 마스크의 매수를 늘립니다.
색 정보에 의한 분할도 있으므로 4×9의 36장까지 다른 마스크를 유지할 수 있게 되어 있습니다.
또한 마스크 이미지가 깨지는 것을 방지하기 위해 마스크 적용을 받는 모든 Drawable 직사각형으로 마스크를 그립니다.
이 때문에 범위의 생성과 마스크 생성, 마스크 사용으로 매트릭스의 생성이 필요하게 됩니다.
마스크용 텍스쳐를 여러 장 이용하는 경우도 분할 방식은 마스크용 텍스쳐 1장만을 이용한 경우와 동일합니다.
단, 마스크용 텍스쳐를 여러 장 이용하는 경우에는 마스크용 텍스쳐 1장에 대한 마스크의 할당을 가능한 한 등분하게 되기 때문에, 같은 모델에서도 그리기 품질이 향상됩니다. (마스크용 텍스쳐를 늘리면 그만큼 처리 비용이 듭니다)
예를 들면, 마스크가 32장의 모델인 경우 일반적으로는 마스크용 텍스쳐 1장으로 32장의 마스크를 그리려고 하지만, 마스크용 텍스쳐를 2장 사용했을 경우의 마스크 할당은 「1장당 16장」이 됩니다.
직사각형 확인
마스크 생성의 첫 번째 단계에서 마스크별로 마스크 적용 대상이 모두 들어가는 직사각형을 확인합니다.
template <class T_ClippingContext, class T_OffscreenSurface> void CubismClippingManager<T_ClippingContext, T_OffscreenSurface>::CalcClippedDrawTotalBounds(CubismModel& model, T_ClippingContext* clippingContext) { // 피 클리핑 마스크(마스킹되는 그리기 오브젝트)의 전체 직사각형 csmFloat32 clippedDrawTotalMinX = FLT_MAX, clippedDrawTotalMinY = FLT_MAX; csmFloat32 clippedDrawTotalMaxX = -FLT_MAX, clippedDrawTotalMaxY = -FLT_MAX; // 이 마스크가 실제로 필요한지 판정한다 // 이 클리핑을 이용하는 「그리기 오브젝트」가 하나라도 사용 가능하면 마스크를 생성할 필요가 있다 const csmInt32 clippedDrawCount = clippingContext->_clippedDrawableIndexList->GetSize(); for (csmInt32 clippedDrawableIndex = 0; clippedDrawableIndex < clippedDrawCount; clippedDrawableIndex++) { // 마스크를 사용하는 그리기 오브젝트가 그려지는 직사각형을 구한다 const csmInt32 drawableIndex = (*clippingContext->_clippedDrawableIndexList)[clippedDrawableIndex]; csmInt32 drawableVertexCount = model.GetDrawableVertexCount(drawableIndex); csmFloat32* drawableVertexes = const_cast<csmFloat32*>(model.GetDrawableVertices(drawableIndex)); csmFloat32 minX = FLT_MAX, minY = FLT_MAX; csmFloat32 maxX = -FLT_MAX, maxY = -FLT_MAX; csmInt32 loop = drawableVertexCount * Constant::VertexStep; for (csmInt32 pi = Constant::VertexOffset; pi < loop; pi += Constant::VertexStep) { csmFloat32 x = drawableVertexes[pi]; csmFloat32 y = drawableVertexes[pi + 1]; if (x < minX) minX = x; if (x > maxX) maxX = x; if (y < minY) minY = y; if (y > maxY) maxY = y; } // if (minX == FLT_MAX) continue; //유효한 점이 하나도 잡히지 않았기 때문에 건너뛴다 // 전체 직사각형에 반영 if (minX < clippedDrawTotalMinX) clippedDrawTotalMinX = minX; if (minY < clippedDrawTotalMinY) clippedDrawTotalMinY = minY; if (maxX > clippedDrawTotalMaxX) clippedDrawTotalMaxX = maxX; if (maxY > clippedDrawTotalMaxY) clippedDrawTotalMaxY = maxY; } if (clippedDrawTotalMinX == FLT_MAX) { clippingContext->_allClippedDrawRect->X = 0.0f; clippingContext->_allClippedDrawRect->Y = 0.0f; clippingContext->_allClippedDrawRect->Width = 0.0f; clippingContext->_allClippedDrawRect->Height = 0.0f; clippingContext->_isUsing = false; } else { clippingContext->_isUsing = true; csmFloat32 w = clippedDrawTotalMaxX - clippedDrawTotalMinX; csmFloat32 h = clippedDrawTotalMaxY - clippedDrawTotalMinY; clippingContext->_allClippedDrawRect->X = clippedDrawTotalMinX; clippingContext->_allClippedDrawRect->Y = clippedDrawTotalMinY; clippingContext->_allClippedDrawRect->Width = w; clippingContext->_allClippedDrawRect->Height = h; } }
색 분리, 분할 분리를 받은 레이아웃 결정
마스크마다 소속되는 마스크 버퍼의 색 채널, 분할 위치를 정합니다.
template <class T_ClippingContext, class T_OffscreenSurface> void CubismClippingManager<T_ClippingContext, T_OffscreenSurface>::SetupLayoutBounds(csmInt32 usingClipCount) const { const csmInt32 useClippingMaskMaxCount = _renderTextureCount <= 1 ? ClippingMaskMaxCountOnDefault : ClippingMaskMaxCountOnMultiRenderTexture * _renderTextureCount; if (usingClipCount <= 0 || usingClipCount > useClippingMaskMaxCount) { if (usingClipCount > useClippingMaskMaxCount) { // 마스크 제한 수 경고를 발생시킨다 csmInt32 count = usingClipCount - useClippingMaskMaxCount; CubismLogError("not supported mask count : %d\n[Details] render texture count: %d\n, mask count : %d" , count, _renderTextureCount, usingClipCount); } // 이 경우 하나의 마스크 타겟을 매번 클리어하여 사용한다 for (csmUint32 index = 0; index < _clippingContextListForMask.GetSize(); index++) { T_ClippingContext* cc = _clippingContextListForMask[index]; cc->_layoutChannelIndex = 0; // 어차피 매번 지우므로 고정해도 된다 cc->_layoutBounds->X = 0.0f; cc->_layoutBounds->Y = 0.0f; cc->_layoutBounds->Width = 1.0f; cc->_layoutBounds->Height = 1.0f; cc->_bufferIndex = 0; } return; } // 렌더 텍스쳐가 1장이라면 9분할(최대 36장) const csmInt32 layoutCountMaxValue = _renderTextureCount <= 1 ? 9 : 8; // 하나의 RenderTexture를 최대한 많이 사용하여 마스크를 레이아웃 // 마스크 그룹의 수가 4 이하이면 RGBA 각 채널에 하나씩 마스크를 배치하고, 5 이상 6 이하이면 RGBA를 2,2,1,1로 배치한다 const csmInt32 countPerSheetDiv = (usingClipCount + _renderTextureCount - 1) / _renderTextureCount; // 렌더 텍스쳐 1장당 몇 장을 할당할 것인가?(올림) const csmInt32 reduceLayoutTextureCount = usingClipCount % _renderTextureCount; // 레이아웃의 수를 1장 줄이는 렌더 텍스쳐의 수(이 수만큼의 렌더 텍스쳐가 대상) // RGBA를 차례로 사용한다 const csmInt32 divCount = countPerSheetDiv / ColorChannelCount; //한 채널에 배치할 기본 마스크 개수 const csmInt32 modCount = countPerSheetDiv % ColorChannelCount; //나머지, 이 번호의 채널까지 하나씩 배분 // RGBA 각 채널을 준비한다(0:R, 1:G, 2:B, 3:A, ) csmInt32 curClipIndex = 0; //순서대로 설정 for (csmInt32 renderTextureIndex = 0; renderTextureIndex < _renderTextureCount; renderTextureIndex++) { for (csmInt32 channelIndex = 0; channelIndex < ColorChannelCount; channelIndex++) { // 이 채널에 배치할 수 // NOTE: 레이아웃 수 = 1채널에 배치할 기본 마스크 + 남은 마스크를 두는 채널이라면 하나 추가 csmInt32 layoutCount = divCount + (channelIndex < modCount ? 1 : 0); // 레이아웃의 수를 1장 줄일 경우에 이를 수행할 채널을 결정 // div가 0일 때는 정상적인 인덱스의 범위 내가 되도록 조정 const csmInt32 checkChannelIndex = modCount + (divCount < 1 ? -1 : 0); // 이번이 대상 채널이고 레이아웃 수를 1장 줄이는 렌더 텍스쳐가 존재하는 경우 if (channelIndex == checkChannelIndex && reduceLayoutTextureCount > 0) { // 현재의 렌더 텍스쳐가 대상 렌더 텍스쳐라면 레이아웃 수를 1장 줄인다 layoutCount -= ! (renderTextureIndex < reduceLayoutTextureCount) ? 1 : 0; } // 분할 방법 결정 if (layoutCount == 0) { // 아무것도 하지 않는다 } else if (layoutCount == 1) { // 모든 것을 그대로 사용 T_ClippingContext* cc = _clippingContextListForMask[curClipIndex++]; cc->_layoutChannelIndex = channelIndex; cc->_layoutBounds->X = 0.0f; cc->_layoutBounds->Y = 0.0f; cc->_layoutBounds->Width = 1.0f; cc->_layoutBounds->Height = 1.0f; cc->_bufferIndex = renderTextureIndex; } else if (layoutCount == 2) { for (csmInt32 i = 0; i < layoutCount; i++) { const csmInt32 xpos = i % 2; T_ClippingContext* cc = _clippingContextListForMask[curClipIndex++]; cc->_layoutChannelIndex = channelIndex; cc->_layoutBounds->X = xpos * 0.5f; cc->_layoutBounds->Y = 0.0f; cc->_layoutBounds->Width = 0.5f; cc->_layoutBounds->Height = 1.0f; cc->_bufferIndex = renderTextureIndex; // UV를 2개로 분해하여 사용 } } else if (layoutCount <= 4) { //4분할하여 사용 for (csmInt32 i = 0; i < layoutCount; i++) { const csmInt32 xpos = i % 2; const csmInt32 ypos = i / 2; T_ClippingContext* cc = _clippingContextListForMask[curClipIndex++]; cc->_layoutChannelIndex = channelIndex; cc->_layoutBounds->X = xpos * 0.5f; cc->_layoutBounds->Y = ypos * 0.5f; cc->_layoutBounds->Width = 0.5f; cc->_layoutBounds->Height = 0.5f; cc->_bufferIndex = renderTextureIndex; } } else if (layoutCount <= layoutCountMaxValue) { //9분할하여 사용 for (csmInt32 i = 0; i < layoutCount; i++) { const csmInt32 xpos = i % 3; const csmInt32 ypos = i / 3; T_ClippingContext* cc = _clippingContextListForMask[curClipIndex++]; cc->_layoutChannelIndex = channelIndex; cc->_layoutBounds->X = xpos / 3.0f; cc->_layoutBounds->Y = ypos / 3.0f; cc->_layoutBounds->Width = 1.0f / 3.0f; cc->_layoutBounds->Height = 1.0f / 3.0f; cc->_bufferIndex = renderTextureIndex; } } // 마스크의 제한 매수를 초과한 경우의 처리 else { csmInt32 count = usingClipCount - useClippingMaskMaxCount; CubismLogError("not supported mask count : %d\n[Details] render texture count: %d\n, mask count : %d" , count, _renderTextureCount, usingClipCount); // 개발 모드의 경우에는 정지시킨다 CSM_ASSERT(0); // 계속 실행할 경우 SetupShaderProgram에서 오버 액세스가 발생하므로 어쩔 수 없이 적당히 넣어 둔다 // 당연히 그리기 결과는 어색해진다. for (csmInt32 i = 0; i < layoutCount; i++) { T_ClippingContext* cc = _clippingContextListForMask[curClipIndex++]; cc->_layoutChannelIndex = 0; cc->_layoutBounds->X = 0.0f; cc->_layoutBounds->Y = 0.0f; cc->_layoutBounds->Width = 1.0f; cc->_layoutBounds->Height = 1.0f; cc->_bufferIndex = 0; } } } } }
마스크 그리기, 마스크 사용의 매트릭스 생성
그리기 전에 조사한 직사각형 범위와 소속 장소에 근거해 마스크 생성용, 마스크 사용용 변환 매트릭스를 준비합니다.
// --- 실제로 하나의 마스크를 그리기 --- T_ClippingContext* clipContext = _clippingContextListForMask[clipIndex]; csmRectF* allClippedDrawRect = clipContext->_allClippedDrawRect; //이 마스크를 사용하는 모든 그리기 오브젝트의 논리 좌표상의 둘러싼 직사각형 csmRectF* layoutBoundsOnTex01 = clipContext->_layoutBounds; // 이 안에 마스크를 넣는다 const csmFloat32 MARGIN = 0.05f; csmFloat32 scaleX = 0.0f; csmFloat32 scaleY = 0.0f; const csmFloat32 ppu = model.GetPixelsPerUnit(); const csmFloat32 maskPixelWidth = clipContext->GetClippingManager()->_clippingMaskBufferSize.X; const csmFloat32 maskPixelHeight = clipContext->GetClippingManager()->_clippingMaskBufferSize.Y; const csmFloat32 physicalMaskWidth = layoutBoundsOnTex01->Width * maskPixelWidth; const csmFloat32 physicalMaskHeight = layoutBoundsOnTex01->Height * maskPixelHeight; _tmpBoundsOnModel.SetRect(allClippedDrawRect); if (_tmpBoundsOnModel.Width * ppu > physicalMaskWidth) { _tmpBoundsOnModel.Expand(allClippedDrawRect->Width * MARGIN, 0.0f); scaleX = layoutBoundsOnTex01->Width / _tmpBoundsOnModel.Width; } else { scaleX = ppu / physicalMaskWidth; } if (_tmpBoundsOnModel.Height * ppu > physicalMaskHeight) { _tmpBoundsOnModel.Expand(0.0f, allClippedDrawRect->Height * MARGIN); scaleY = layoutBoundsOnTex01->Height / _tmpBoundsOnModel.Height; } else { scaleY = ppu / physicalMaskHeight; } // 마스크를 생성할 때 사용할 행렬을 구한다 createMatrixForMask(isRightHanded, layoutBoundsOnTex01, scaleX, scaleY); clipContext->_matrixForMask.SetMatrix(_tmpMatrixForMask.GetArray()); clipContext->_matrixForDraw.SetMatrix(_tmpMatrixForDraw.GetArray());
마스크 버퍼의 동적 크기 변경
GLES2 렌더러는 실행 시에 마스크 버퍼의 크기를 변경하는 API를 제공합니다.
현재 마스크 버퍼의 사이즈는 초기값으로 256*256(픽셀)을 설정하고 있는데 마스크 생성 영역을 9매로 자르는 경우 85*85(픽셀)의 직사각형 영역에 묘화한 마스크 형상을 한층 더 확대해 클리핑 영역으로서 사용합니다.
그 결과 클리핑 결과의 가장자리가 흐리거나 번지는 현상이 나타납니다.
이를 해결하는 방법으로 마스크 버퍼의 크기를 프로그램 실행 시에 변경하는 API를 제공합니다.
예를 들어, 마스크 버퍼의 크기를 256*256 ⇒ 1024*1024로 함으로써 마스크 생성 영역을 9매로 자르는 경우 341*341의 직사각형 영역에 마스크 형상을 그릴 수 있으므로,
클리핑 영역으로 확대하여 사용해도 클리핑 결과의 가장자리의 흐림이나 번짐을 없앨 수 있습니다.
※마스크 버퍼의 사이즈를 크게 한다 ⇒ 처리하는 픽셀이 증가하면 속도는 느려지지만, 묘화 결과는 깨끗해진다.
※마스크 버퍼의 사이즈를 작게 한다 ⇒ 처리하는 픽셀이 줄어들기 때문에 속도는 빨라지지만, 묘화 결과는 더러워진다.
void CubismRenderer_OpenGLES2::SetClippingMaskBufferSize(csmFloat32 width, csmFloat32 height) { if (_clippingManager == NULL) { return; } // 인스턴스 파기 전에 렌더 텍스쳐 수를 저장 const csmInt32 renderTextureCount = _clippingManager->GetRenderTextureCount(); //OffscreenSurface의 크기를 변경하기 위해 인스턴스를 파기하고 다시 작성 CSM_DELETE_SELF(CubismClippingManager_OpenGLES2, _clippingManager); _clippingManager = CSM_NEW CubismClippingManager_OpenGLES2(); _clippingManager->SetClippingMaskBufferSize(width, height); _clippingManager->Initialize( *GetModel(), renderTextureCount ); }
전처리 방식으로 성능 향상을 기대할 수 있는 이유
휴대 단말기 특유의 사정으로 GPU에 대한 Clear 명령이나 렌더링 타깃 전환 명령의 처리 비용이 다른 명령보다 높을 수 있습니다.
원칙적인 방식으로 그릴 때는 이러한 처리 비용이 높은 명령을 마스크가 필요한 Drawable의 수만큼 실행하게 됩니다.
그러나 전처리 방식의 경우에는 이러한 명령을 실행하는 횟수를 줄일 수 있으므로 스마트폰 등에서의 성능 향상을 기대할 수 있습니다.
실제로 그 효과를 파악하기 위해, 렌더링에 있어서의 각 처리 단위로 시간 코스트를 측정해 보겠습니다.
측정 방법으로서 아래에 표시된 소스 코드로 확인합니다. 레이어는 빌드별로 분리하여 측정합니다.
또 테스트 대상의 모델은 Haru 1개입니다.
측정하는 단말로서는 Android 기기를 2종류, Windows 기기를 1종류 준비했습니다.
측정은 Android 측에서 clock_gettime 함수, Windows 측에서 QueryPerformanceCounter 함수를 사용하여 버퍼에 결과를 캐시하여 평균값을 계산한다는 방침으로 측정합니다.
클리핑 마스크 생성부(레이어 1)
void CubismClippingManager_OpenGLES2::SetupClippingContext(CubismModel& model, CubismRenderer_OpenGLES2* renderer) { ・ ・ ・ { // ★그리기 타깃 전환 측정 P_TIME1(ProcessingTime cl(s_switch);) // ---------- 마스크 그리기 처리 ----------- // 마스크용 RenderTexture를 active로 설정 glBindFramebuffer(GL_FRAMEBUFFER, _maskRenderTexture); } { // ★버퍼 클리어(채우기 처리)의 측정 P_TIME1(ProcessingTime cl(s_clear);) // 마스크 지우기 // (임시 사양) 1이 무효(그려지지 않는) 영역, 0이 유효(그려지는) 영역. (셰이더로 Cd*Cs에서 0에 가까운 값을 곱하여 마스크를 만든다. 1을 걸면 아무 일도 일어나지 않는다) glClearColor(1.0f, 1.0f, 1.0f, 1.0f); glClear(GL_COLOR_BUFFER_BIT); } ・ ・ ・ { // ★그리기 타깃 전환 측정 2 P_TIME1(ProcessingTime cl(s_switch);) // --- 후처리 --- glBindFramebuffer(GL_FRAMEBUFFER, oldFBO); // 그리기 대상 반환 } ・ ・ ・ }
CubismClippingManager_OpenGLES2::SetupClippingContext는 그리기 타깃의 전환과 채우기 시간을 측정합니다.
모델 그리기 전체(레이어 1, 2 혼재)
void CubismRenderer_OpenGLES2::DoDrawModel() { { // ★ 마스크 버퍼 생성 전체 측정 P_TIME2(ProcessingTime makemask(s_maskmake);) if (_clippingManager ! = NULL) { PreDraw(); _clippingManager->SetupClippingContext(*GetModel(), this); } } { // ★그리기 전처리 측정 P_TIME1(ProcessingTime makemask(s_predraw);) // 상기 클리핑 처리 내에서도 한 번 PreDraw를 호출하므로 주의!! PreDraw(); } const csmInt32 drawableCount = GetModel()->GetDrawableCount(); const csmInt32* renderOrder = GetModel()->GetDrawableRenderOrders(); { // ★정렬 시간 측정 P_TIME1(ProcessingTime makemask(s_sort);) // 인덱스를 그리기 순서로 정렬 for (csmInt32 i = 0; i < drawableCount; ++i) { const csmInt32 order = renderOrder[i]; _sortedDrawableIndexList[order] = i; } } { // ★마스크 이외의 그리기 시간 측정 P_TIME2(ProcessingTime makemask(s_draw);) // 그리기 for (csmInt32 i = 0; i < drawableCount; ++i) { const csmInt32 drawableIndex = _sortedDrawableIndexList[i]; // 클리핑 마스크 설정 SetClippingContextBufferForDraw(clipContext); IsCulling(GetModel()->GetDrawableCulling(drawableIndex) ! = 0); DrawMeshOpenGL(*GetModel(), drawableIndex); } } { // ★그리기 후처리 측정 P_TIME1(ProcessingTime makemask(s_post);) // PostDraw(); } }
그리기 전, 정렬, 그리기 후처리의 측정을 합니다.
레이어를 나누어 마스크 생성과 그 이외의 묘화라는 큰 틀에서도 측정합니다.
메쉬 그리기(레이어 1)
void CubismRenderer_OpenGLES2::DrawMeshOpenGL(const CubismModel& model, const csmInt32 index) { ・ ・ ・ { // ★셰이더에 데이터 설정 시간을 측정 P_TIME1(ProcessingTime sharder(s_sharder);) if (IsGeneratingMask()) // 마스크 생성 시 { CubismShader_OpenGLES2::GetInstance()->SetupShaderProgramForMask(this, model, index); } else { CubismShader_OpenGLES2::GetInstance()->SetupShaderProgramForDraw(this, model, index); } } { // ★그리기 명령 단일 시간 측정 P_TIME1(ProcessingTime gldraw(s_gldraw);) // 폴리곤 메쉬 그리기 glDrawElements(GL_TRIANGLES, indexCount, GL_UNSIGNED_SHORT, indexArray); } // 후처리 glUseProgram(0); SetClippingContextBufferForDraw(NULL); SetClippingContextBufferForMask(NULL); }
CubismRenderer_OpenGLES2::DrawMesh는 셰이더에 대한 설정 시간과 그리기 명령 단일 시간을 측정합니다.
레이어 3
void LAppModel::Update() { { P_TIME3(ProcessingTime up(s_paramup);) const csmFloat32 deltaTimeSeconds = LAppPal::GetDeltaTime(); _userTimeSeconds += deltaTimeSeconds; ・ ・ ・ // 포즈 설정 if (_pose ! = NULL) { _pose->UpdateParameters(_model, deltaTimeSeconds); } } { P_TIME3(ProcessingTime ren(s_modelup);) _model->Update(); } }
void LAppModel::Draw(CubismMatrix44& matrix) { P_TIME3(ProcessingTime ren(s_rendering);) matrix.MultiplyByMatrix(_modelMatrix); GetRenderer<Rendering::CubismRenderer_OpenGLES2>()->SetMvpMatrix(&matrix); DoDraw(); }
대략적인 Update 흐름
파라미터 계산, 모델 업데이트, 렌더링의 세 가지로 나누어 살펴보겠습니다.
결과
Android1 | Android2 | Winpc1 | |
L1clear | 1781.20 | 218.80 | 26.80 |
L1gldraw | 45.47 | 51.63 | 10.58 |
L1sharder | 12.31 | 9.34 | 5.37 |
L1post | 1.50 | 1.00 | 0.10 |
L1switch | 10.70 | 56.30 | 7.80 |
L1predraw | 15.90 | 8.20 | 2.20 |
L1sort | 7.60 | 7.00 | 0.60 |
L2MaskMake | 2686.80 | 1357.60 | 318.50 |
L2draw | 4004.10 | 4013.20 | 1217.00 |
L3paramupdate | 392.00 | 375.40 | 89.70 |
L3modelupdate | 1357.50 | 1410.90 | 1070.40 |
L3rendering | 6715.70 | 5233.70 | 1892.00 |
위의 표는 앞에서 설명한 부분의 실행 시간입니다.
휴대 단말기는 Clear의 비용이 높거나 렌더링 타깃의 전환이 다른 명령에 비해 무거운 것을 알 수 있습니다.
이 무거운 명령이 원칙적인 방식으로 그릴 때 마스크가 필요한 Drawable의 수만큼 실행됩니다.
이 계산이 한 번으로 끝나기 때문에 스마트폰 등에서의 퍼포먼스의 향상을 기대할 수 있습니다.
마스크 처리를 고선명 방식으로 전환
앞서 언급했듯이, 그릴 때마다 마스크를 생성하는 방식이라면 낮은 사양 단말기에서는 성능에 영향이 있습니다.
그러나 최종적으로 동영상으로서 출력하는 경우와 같이, 런타임에서의 퍼포먼스보다 화면의 품질을 중시하는 경우는 이쪽 방식이 더 적합합니다.
2018/12/20 이후의 SDK에서는 마스크 처리를 고선명 방식으로 전환할 수 있습니다.
고선명 방식으로 전환하려면 다음 API에 true를 전달합니다.
CubismRenderer::UseHighPrecisionMask()