Investment/투자분석

빅데이터 산업 분석

사막여유 2022. 10. 2. 20:36
728x90

 

인공지능 관련 기업들을 보니 아직 인공지능을 이용하여 크게 돈을 벌거나

큰 기업들을 능가할 수 있는 기술을 가진 기업들이 크게 눈에띄지 않았습니다.

 

물론 아직 보지못한 기업들이 한참 많을 것으로 생각이 들지만

제가 투자해야 할 인공지능관련 기업을 찾다보니

빅데이터 산업과 관련된 기업들도 찾아보게 되었고

인공지능과 함께 크게 성장할 수 있는 산업군이라고 생각이 들었습니다.

 

저번 블로그 글에서 작성했다시피

최근 인공지능 머신러닝 중 가장 빠르게 발전하고있는 분야는

딥러닝분야인데 해당 분야에서 가장 필요한 부분은 GPU와 빅데이터입니다.

 

딥러닝 학습을 진행할 때 문제와 답을 알려주는 지도학습방식이 아닌

방대한 양의 데이터를 기반으로한 비지도학습이 기반이 되기 때문에

빅데이터가 필수적인 것 입니다.

 

따라서 빅데이터를 혁신적으로 가공하고 수집 및 제공할 수 있는 기업에 대해서 알아보겠습니다.

 

 

빅데이터란?

 

 

간략하게 빅데이터에 대해서 설명하고 넘어가겠습니다.

 

빅데이터의 정의를 보면

" 빅데이터란 디지털 환경에서 생성되는 데이터로,

기존 데이터보다 매우 방대하여 기존의 도구나 방법으로 수집, 저장, 분석이 어려운 데이터 "

를 의미하고 있습니다.

 

빅데이터는 이름만 보면 단순히 데이터의 양이 방대하기 때문에 빅데이터라고 불리우는 것 같지만

빅데이터라고 부르기 위한 특징이 3가지가 존재합니다.

 

  1. 크기 ( Volume )
  2. 속도 ( Velocity )
  3. 다양성 ( Variety )

 

첫번째 특징으로는 크기 ( Volume )를 말하고 있는데

일반적으로 몇십 테라바이트 , 페타바이트 이상의 규모를 가질 수 있어야합니다.

그리고 그 소스들은 SNS에서 그 규모를 가지고 있습니다.

 

두번째 특징으로는 속도 ( Velocity )인데

위와같은 크기를 가진 데이터들을 빠르게 처리하고 분석할 수 있는 처리능력을 말합니다.

데이터들은 굉장히 빠른속도로 지금도 생성되어지고 있는데

이를 실시간 또는 주기에따라 처리할 수있어야 합니다.

 

세번째 특징으로는 다양성 ( Varitey )인데

정형데이터뿐 아니라 텍스트, 영상,로그기록,인간관계(소셜데이터) 등 다양한 데이터를 대상으로 해야합니다.

 

최근에는 Vlaue(값), Veracity(정확성), Variability(가변성), Visualization(시각화) 등이

새로운 개념으로 추가되었다고 합니다.

 

이렇게 한 문장으로 커도 괜찮고, 빨라도 괜찮고, 다양해도 괜찮다는 의미로 볼 수 있는 것입니다.

 

또한 빅데이터가 분류해야하는 데이터의 종류는 아래와같이 3가지로 분류됩니다.

 

  1. 정형 데이터

- 해당 값이 의미를 파악하기 쉽고, 규칙적인 값으로 데이터가 들어갈 경우

 

2. 비정형 데이터

- 정해진 규칙이 없어 값의 의미를 쉽게 파악하기 힘든 경우

( 보통 텍스트, 음성, 영상과 같은 데이터를 의미 )

 

3. 반정형 데이터

- 어려운 개념인데 쉽게 이야기하면

정형 데이터와 비정형 데이터와 완벽히 구분되지 않는 경우로 볼 수 있다.

완전한 정형이 아니라 약한 정형 데이터라는 뜻을 담고있는 경우

( HTML, XML, JSON 문서나 웹 로그 등 )

 

* 빅데이터의 85% 가량은 형태가 정해지지 않은 비정형 데이터라고 합니다.

또한 그 비중도 늘고있는 형태 입니다.

 

 

마지막으로 실제 기업에서는 이 빅데이터를 도대체 어떻게 사용하고 활용하고 있는 것인지를

알아보기 위한 기술을 살펴보겠습니다.

 

http://www.codingworldnews.com/news/articleView.html?idxno=2444

 

빅데이터를 이해하기 위해 알아야 할 3가지 정보 - 코딩월드뉴스

3가지 정보로 빅데이터 이해하기- 3요소 : 빅데이터와 관련된 3가지 정보들에 대해 소개하고자 합니다.빅데이터의 속성?요즘에는 빅데이터의 중요성이 커짐에 따라 그만큼 이제는 대중적으로 많

www.codingworldnews.com

 

 

위 기사를 참고하여 작성하였습니다.

 

  1. 저장기술

 

- 다양하고 많은 양의 빅데이터를 저장하고 관리하는 기술,

대표적으로 하둡 ( Hadoop ) , NoSQL ( Not Only SQL ) 이라는 기술이 있습니다.

하둡은 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크이고

NoSQL은 가용성과 확장성에 중점을 둔 데이터베이스 시스템입니다.

 

- 비정형 데이터의 저장을 위해 유연한 데이터 모델 지원과 저렴한 비용으로 분산처리와

병렬처리가 가능하다는 특징

 

2. 분석기술

 

- 비정형 데이터, 반정형 데이터가 정형데이터보다 상대적으로 많이 증가하고 있는 추세인데

이를 정확하게 분석하기 위한 기술이 주목받고 있습니다.

 

- 통계학, 전산학 분야에서 텍스트마이닝 , 기계학습, 패턴인식, 자연어 처리 등의 기술이

빅데이터의 분석기술에 해당

 

위 분석기술에 대한 자세한 내용은 아래 블로그에서 참고하면 좋을 것 같습니다.

 

https://m.blog.naver.com/dsjang650628/221872145140

 

빅데이터 분석기법 및 처리기술

빅데이터 분석기법 글로벌 컨설팅 그룹 맥킨지&컴퍼니 산하 경제연구소인 맥킨지 글로벌 인스티튜트는 ...

blog.naver.com

 

요즘 많이 보이고있는 용어인

 

Product Market Fit 관련 기사에서도 볼 수 있듯이

스타트업이나 기업들에서 제품을 낼 때 실패하는 가장 큰 이유는

' 시장 수요 부족 ' 이라고 합니다.

 

하지만 원하는 시장의 빅데이터를 수집하고 가공하면

제품을 출시하고 기획하기 전 해당 시장의 수요와 반응을 어느정도 미리 파악할 수 있는

중요한 장점이 있습니다.

 

따라서 서비스업에서의 빅데이터 수요 규모가 커질 수 밖에 없을 것으로 보이고

있습니다.

 

인공지능에서도 많은 수요를 필요로 하고있지만

다른 분야에서도 굉장히 많은 수요가 있기 때문에 크게 성장하고 있는 분야로 보고있습니다.

 

 

[ 빅데이터 시장 규모 ]

 

 

 

< 시장규모 >

 

전세계 빅데이터 시장은 2020년 1,388억 8,600만 달러 ( 200조 1,347억 2,600만 원 ) 에서 연평균 성장률 10.6%로 증가하여 2025년에는 2,294억 2,300만 달러 ( 330조 5,985억 4,300만 원 )에 이를 것으로 전망된다고 합니다.

 

 

< 빅데이터 시장 종류별 규모 >

 

전세계 빅데이터 시장은 종류에 따라 서비스, 소프트웨어로 분류되는데

 

서비스는 2019년 988억 8,000만 달러에서 연평균 성장률 13.95%로 증가하여, 2024년에는 1,899억 7,000만 달러(273조 7,467억 7,000만 원)에 이를 것으로 전망하고있고

 

소프트웨어는 2019년 665억 2,000만 달러에서 연평균 성장률 12.13%로 증가하여, 2024년에는 1,179억 3,000만 달러(169조 9,371억 3,000만 원)에 이를 것으로 전망

 

아직 어디서 소프트웨어를 사용하고 서비스를 사용하는지에 대한 정보를 찾아보지 않았기 때문에

해당 부분은 추후 다시 봐야할 것으로 보입니다.

 

 

< 조직 규모별 시장 규모 >

 

전 세계 빅데이터 시장은 조직 규모에 따라 대기업, 중소기업으로 분류하는데

 

대기업은 2020년 919억 7,700만 달러에서 연평균 성장률 10.4%로 증가하여, 2025년에는 1,506억 9,500만 달러(217조 1,514억 9,500만 원)에 이를 것으로 전망

 

중소기업은 2020년 469억 900만 달러에서 연평균 성장률 10.9%로 증가하여, 2025년에는 787억 2,800만 달러(113조 4,470억 4,800만 원)에 이를 것으로 전망

 

 

< 산업 분야별 시장규모 및 전망 >

 

전 세계 빅데이터 시장은 산업 분야에 따라 은행·금융서비스·보험(BFSI), 정부 및 방위, 헬스케어 및 생명과학, 제조, 소매 및 소비재, 미디어 및 엔터테인먼트, 통신 및 IT, 운송 및 물류, 기타로 분류

 

- 은행·금융서비스·보험(BFSI)은 2020년 255억 2,000만 달러에서 연평균 성장률 6.6%로 증가하여, 2025년에는 350억 5,800만 달러(50조 5,185억 7,800만 원)에 이를 것으로 전망

 

- 정부 및 방위는 2020년 149억 4,600만 달러에서 연평균 성장률 12.2%로 증가하여, 2025년에는 266억 3,200만 달러(38조 3,767억 1,200만 원)에 이를 것으로 전망

 

- 헬스케어 및 생명과학은 2020년 97억 2,900만 달러에서 연평균 성장률 12.5%로 증가하여, 2025년에는 175억 2,800만 달러(25조 2,578억 4,800만 원)에 이를 것으로 전망

 

- 제조는 2020년 133억 6,600만 달러에서 연평균 성장률 13.3%로 증가하여, 2025년에는 249억 900만 달러(35조 8,938억 6,900만 원)에 이를 것으로 전망

 

- 소매 및 소비재는 2020년 202억 5,500만 달러에서 연평균 성장률 10.7%로 증가하여, 2025년에는 336억 9,600만 달러(48조 5,559억 3,600만 원)에 이를 것으로 전망

 

- 미디어 및 엔터테인먼트는 2020년 140억 4,100만 달러에서 연평균 성장률 11.0%로 증가하여, 2025년에는 236억 1,200만 달러(20조 2,330억 8,100만 원)에 이를 것으로 전망

 

- 통신 및 IT는 2020년 159억 4,000만 달러에서 연평균 성장률 9.2%로 증가하여, 2025년에는 247억 9,200만 달러(35조 7,252억 7,200만 원)에 이를 것으로 전망

 

- 운송 및 물류는 2020년 113억 달러에서 연평균 성장률 11.9%로 증가하여, 2025년에는 197억 9,700만 달러(28조 5,274억 7,700만 원)에 이를 것으로 전망

 

- 기타는 2020년 137억 8,900만 달러에서 연평균 성장률 11.2%로 증가하여, 2025년에는 234억 달러(33조 7,194억 원)에 이를 것으로 전망

 

 

이를 보면 연평균 성장률은 가장 작지만 시장규모가 가장 큰 분야 은행·금융서비스·보험(BFSI) 이고

평균적으로 높은 연평균 성장률과 시장 규모를 가진 분야

정부 및 방위, 소매 및 소비재, 제조 분야라고 볼 수 있습니다.

 

 

< 지역별 시장규모 및 전망 >

 

 

전 세계 빅데이터 시장을 지역별로 살펴보면, 2020년을 기준으로 북아메리카 지역이 30.3%로 가장 높은 점유율을 차지

 

- 북아메리카는 2020년 420억 9,100만 달러에서 연평균 성장률 9.3%로 증가하여, 2025년에는 656억 2,700만 달러(94조 5,685억 700만 원)에 이를 것으로 전망

 

- 유럽은 2020년 366억 900만 달러에서 연평균 성장률 10.2%로 증가하여, 2025년에는 595억 4,400만 달러(85조 8,029억 400만 원)에 이를 것으로 전망

 

- 아시아-태평양은 2020년 323억 7,300만 달러에서 연평균 성장률 11.9%로 증가하여, 2025년에는 568억 2,100만 달러(81조 8,790억 6,100만 원)에 이를 것으로 전망

 

- 중동 및 아프리카 지역은 2020년 177억 3,500만 달러에서 연평균 성장률 11.4%로 증가하여, 2025년에는 304억 1,100만 달러(43조 8,222억 5,100만 원)에 이를 것으로 전망

 

- 라틴아메리카 지역은 2020년 100억 7,800만 달러에서 연평균 성장률 11.0%로 증가하여, 2025년에는 170억 2,000만 달러(24조 5,258억 2,000만 원)에 이를 것으로 전망

 

 

지역별 통계데이터를 살펴본 결과 북아메리카와 유럽의 시장규모가 가장 크다고 볼 수 있다.

물론 아시아-태평양 시장규모와 크게 차이가나지 않기 때문에 2025년 시장규모는

중동 및 아프리카 , 라틴아메리카지역을 제외하고는 모두 비슷하다고 볼 수 있을 것 같습니다.

 

 

종합적인 데이터들을 봤을 때

북아메리카, 유럽, 아시아-태평양 지역에 있는 소매 및 소비재, 제조분야의 대기업에

서비스를 제공하는 기업을 찾는다면

시장의 규모와 트랜드를 모두 잡을 수 있는 기업이라고 볼 수 있을 것 같습니다.

 

정부 및 방위의 빅데이터를 제공할 수 있는 그리고 어떤 빅데이터를 요구로 하는지 알 수 있는

기업은 각 나라에 속한 기업이어야 하지 않을까 라는 생각과

저는 Nasdaq에서 기업을 분석하기 때문에 미국 정부를 상대로하는 기업이 아니라고 한다면

해당 기업은 제외하고 분석하는게 맞을 것 같습니다.

 

빅데이터 기업 리스팅

 

출처 입력

< 알테릭스 >

 

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

 

 

 

< 데이터독 >

 

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

 

 

< 엘라스틱 >

 

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

 

< 스플렁크 >

 

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

대표사진 삭제

사진 설명을 입력하세요.

 

제가 조사하고 있는 빅데이터 기업들이 대체로 부채가 높은 비율로 잡힙니다.

데이터독 ( DDOG ) 이외에는 아직 순이익이 흑자가 난 기업이 없는 것으로 보아

아직 빅데이터 산업에서 순이익이 일어나기에는 힘든 구조이지 않을까 싶습니다.

 

어떤 이유에서 아직 흑자가 나지 못하고 있는지

또한 위 기업들 중 어떻게 데이터독은 흑자를 낼 수 있었는지에 대해서 알아보겠습니다.

 

그리고 제가 아직 빅데이터 기업이 어떤 방식으로 돈을 벌고 있는지 잘 모르기도하고

빅데이터 관련 개념이 정리되지 않았기 때문에

일단 몇주동안은 관련 도서를 읽으면서 빅데이터 자체에 대한 분석을 진행해 보겠습니다.

 

728x90

'Investment > 투자분석' 카테고리의 다른 글

크록스 기업분석 (2)  (2) 2022.11.22
크록스 분석 (1)  (0) 2022.11.22
인공지능 기초상식  (0) 2022.09.27
인공지능과 빅데이터 분석 ( 나노디멘션 동향 )  (2) 2022.09.24
나노디멘션 실적발표  (0) 2022.09.04