인공지능 관련 기업들을 보니 아직 인공지능을 이용하여 크게 돈을 벌거나
큰 기업들을 능가할 수 있는 기술을 가진 기업들이 크게 눈에띄지 않았습니다.
물론 아직 보지못한 기업들이 한참 많을 것으로 생각이 들지만
제가 투자해야 할 인공지능관련 기업을 찾다보니
빅데이터 산업과 관련된 기업들도 찾아보게 되었고
인공지능과 함께 크게 성장할 수 있는 산업군이라고 생각이 들었습니다.
저번 블로그 글에서 작성했다시피
최근 인공지능 머신러닝 중 가장 빠르게 발전하고있는 분야는
딥러닝분야인데 해당 분야에서 가장 필요한 부분은 GPU와 빅데이터입니다.
딥러닝 학습을 진행할 때 문제와 답을 알려주는 지도학습방식이 아닌
방대한 양의 데이터를 기반으로한 비지도학습이 기반이 되기 때문에
빅데이터가 필수적인 것 입니다.
따라서 빅데이터를 혁신적으로 가공하고 수집 및 제공할 수 있는 기업에 대해서 알아보겠습니다.
빅데이터란?
간략하게 빅데이터에 대해서 설명하고 넘어가겠습니다.
빅데이터의 정의를 보면
" 빅데이터란 디지털 환경에서 생성되는 데이터로,
기존 데이터보다 매우 방대하여 기존의 도구나 방법으로 수집, 저장, 분석이 어려운 데이터 "
를 의미하고 있습니다.
빅데이터는 이름만 보면 단순히 데이터의 양이 방대하기 때문에 빅데이터라고 불리우는 것 같지만
빅데이터라고 부르기 위한 특징이 3가지가 존재합니다.
- 크기 ( Volume )
- 속도 ( Velocity )
- 다양성 ( Variety )
첫번째 특징으로는 크기 ( Volume )를 말하고 있는데
일반적으로 몇십 테라바이트 , 페타바이트 이상의 규모를 가질 수 있어야합니다.
그리고 그 소스들은 SNS에서 그 규모를 가지고 있습니다.
두번째 특징으로는 속도 ( Velocity )인데
위와같은 크기를 가진 데이터들을 빠르게 처리하고 분석할 수 있는 처리능력을 말합니다.
데이터들은 굉장히 빠른속도로 지금도 생성되어지고 있는데
이를 실시간 또는 주기에따라 처리할 수있어야 합니다.
세번째 특징으로는 다양성 ( Varitey )인데
정형데이터뿐 아니라 텍스트, 영상,로그기록,인간관계(소셜데이터) 등 다양한 데이터를 대상으로 해야합니다.
최근에는 Vlaue(값), Veracity(정확성), Variability(가변성), Visualization(시각화) 등이
새로운 개념으로 추가되었다고 합니다.
이렇게 한 문장으로 커도 괜찮고, 빨라도 괜찮고, 다양해도 괜찮다는 의미로 볼 수 있는 것입니다.
또한 빅데이터가 분류해야하는 데이터의 종류는 아래와같이 3가지로 분류됩니다.
- 정형 데이터
- 해당 값이 의미를 파악하기 쉽고, 규칙적인 값으로 데이터가 들어갈 경우
2. 비정형 데이터
- 정해진 규칙이 없어 값의 의미를 쉽게 파악하기 힘든 경우
( 보통 텍스트, 음성, 영상과 같은 데이터를 의미 )
3. 반정형 데이터
- 어려운 개념인데 쉽게 이야기하면
정형 데이터와 비정형 데이터와 완벽히 구분되지 않는 경우로 볼 수 있다.
완전한 정형이 아니라 약한 정형 데이터라는 뜻을 담고있는 경우
( HTML, XML, JSON 문서나 웹 로그 등 )
* 빅데이터의 85% 가량은 형태가 정해지지 않은 비정형 데이터라고 합니다.
또한 그 비중도 늘고있는 형태 입니다.
마지막으로 실제 기업에서는 이 빅데이터를 도대체 어떻게 사용하고 활용하고 있는 것인지를
알아보기 위한 기술을 살펴보겠습니다.
http://www.codingworldnews.com/news/articleView.html?idxno=2444
빅데이터를 이해하기 위해 알아야 할 3가지 정보 - 코딩월드뉴스
3가지 정보로 빅데이터 이해하기- 3요소 : 빅데이터와 관련된 3가지 정보들에 대해 소개하고자 합니다.빅데이터의 속성?요즘에는 빅데이터의 중요성이 커짐에 따라 그만큼 이제는 대중적으로 많
www.codingworldnews.com
위 기사를 참고하여 작성하였습니다.
- 저장기술
- 다양하고 많은 양의 빅데이터를 저장하고 관리하는 기술,
대표적으로 하둡 ( Hadoop ) , NoSQL ( Not Only SQL ) 이라는 기술이 있습니다.
하둡은 대용량 데이터를 분산 처리할 수 있는 자바 기반의 오픈소스 프레임워크이고
NoSQL은 가용성과 확장성에 중점을 둔 데이터베이스 시스템입니다.
- 비정형 데이터의 저장을 위해 유연한 데이터 모델 지원과 저렴한 비용으로 분산처리와
병렬처리가 가능하다는 특징
2. 분석기술
- 비정형 데이터, 반정형 데이터가 정형데이터보다 상대적으로 많이 증가하고 있는 추세인데
이를 정확하게 분석하기 위한 기술이 주목받고 있습니다.
- 통계학, 전산학 분야에서 텍스트마이닝 , 기계학습, 패턴인식, 자연어 처리 등의 기술이
빅데이터의 분석기술에 해당
위 분석기술에 대한 자세한 내용은 아래 블로그에서 참고하면 좋을 것 같습니다.
빅데이터 분석기법 및 처리기술
빅데이터 분석기법 글로벌 컨설팅 그룹 맥킨지&컴퍼니 산하 경제연구소인 맥킨지 글로벌 인스티튜트는 ...
blog.naver.com
요즘 많이 보이고있는 용어인
Product Market Fit 관련 기사에서도 볼 수 있듯이
스타트업이나 기업들에서 제품을 낼 때 실패하는 가장 큰 이유는
' 시장 수요 부족 ' 이라고 합니다.
하지만 원하는 시장의 빅데이터를 수집하고 가공하면
제품을 출시하고 기획하기 전 해당 시장의 수요와 반응을 어느정도 미리 파악할 수 있는
중요한 장점이 있습니다.
따라서 서비스업에서의 빅데이터 수요 규모가 커질 수 밖에 없을 것으로 보이고
있습니다.
인공지능에서도 많은 수요를 필요로 하고있지만
다른 분야에서도 굉장히 많은 수요가 있기 때문에 크게 성장하고 있는 분야로 보고있습니다.
[ 빅데이터 시장 규모 ]
참고 : 빅데이터 동향 Issue Report
https://www.innopolis.or.kr/aivorySearch?menuId=MENU00707&schType01=basic
연구개발특구진흥재단
연구개발특구진흥재단
www.innopolis.or.kr
< 시장규모 >

전세계 빅데이터 시장은 2020년 1,388억 8,600만 달러 ( 200조 1,347억 2,600만 원 ) 에서 연평균 성장률 10.6%로 증가하여 2025년에는 2,294억 2,300만 달러 ( 330조 5,985억 4,300만 원 )에 이를 것으로 전망된다고 합니다.
< 빅데이터 시장 종류별 규모 >

전세계 빅데이터 시장은 종류에 따라 서비스, 소프트웨어로 분류되는데
서비스는 2019년 988억 8,000만 달러에서 연평균 성장률 13.95%로 증가하여, 2024년에는 1,899억 7,000만 달러(273조 7,467억 7,000만 원)에 이를 것으로 전망하고있고
소프트웨어는 2019년 665억 2,000만 달러에서 연평균 성장률 12.13%로 증가하여, 2024년에는 1,179억 3,000만 달러(169조 9,371억 3,000만 원)에 이를 것으로 전망
아직 어디서 소프트웨어를 사용하고 서비스를 사용하는지에 대한 정보를 찾아보지 않았기 때문에
해당 부분은 추후 다시 봐야할 것으로 보입니다.
< 조직 규모별 시장 규모 >

전 세계 빅데이터 시장은 조직 규모에 따라 대기업, 중소기업으로 분류하는데
대기업은 2020년 919억 7,700만 달러에서 연평균 성장률 10.4%로 증가하여, 2025년에는 1,506억 9,500만 달러(217조 1,514억 9,500만 원)에 이를 것으로 전망
중소기업은 2020년 469억 900만 달러에서 연평균 성장률 10.9%로 증가하여, 2025년에는 787억 2,800만 달러(113조 4,470억 4,800만 원)에 이를 것으로 전망
< 산업 분야별 시장규모 및 전망 >

전 세계 빅데이터 시장은 산업 분야에 따라 은행·금융서비스·보험(BFSI), 정부 및 방위, 헬스케어 및 생명과학, 제조, 소매 및 소비재, 미디어 및 엔터테인먼트, 통신 및 IT, 운송 및 물류, 기타로 분류
- 은행·금융서비스·보험(BFSI)은 2020년 255억 2,000만 달러에서 연평균 성장률 6.6%로 증가하여, 2025년에는 350억 5,800만 달러(50조 5,185억 7,800만 원)에 이를 것으로 전망
- 정부 및 방위는 2020년 149억 4,600만 달러에서 연평균 성장률 12.2%로 증가하여, 2025년에는 266억 3,200만 달러(38조 3,767억 1,200만 원)에 이를 것으로 전망
- 헬스케어 및 생명과학은 2020년 97억 2,900만 달러에서 연평균 성장률 12.5%로 증가하여, 2025년에는 175억 2,800만 달러(25조 2,578억 4,800만 원)에 이를 것으로 전망
- 제조는 2020년 133억 6,600만 달러에서 연평균 성장률 13.3%로 증가하여, 2025년에는 249억 900만 달러(35조 8,938억 6,900만 원)에 이를 것으로 전망
- 소매 및 소비재는 2020년 202억 5,500만 달러에서 연평균 성장률 10.7%로 증가하여, 2025년에는 336억 9,600만 달러(48조 5,559억 3,600만 원)에 이를 것으로 전망
- 미디어 및 엔터테인먼트는 2020년 140억 4,100만 달러에서 연평균 성장률 11.0%로 증가하여, 2025년에는 236억 1,200만 달러(20조 2,330억 8,100만 원)에 이를 것으로 전망
- 통신 및 IT는 2020년 159억 4,000만 달러에서 연평균 성장률 9.2%로 증가하여, 2025년에는 247억 9,200만 달러(35조 7,252억 7,200만 원)에 이를 것으로 전망
- 운송 및 물류는 2020년 113억 달러에서 연평균 성장률 11.9%로 증가하여, 2025년에는 197억 9,700만 달러(28조 5,274억 7,700만 원)에 이를 것으로 전망
- 기타는 2020년 137억 8,900만 달러에서 연평균 성장률 11.2%로 증가하여, 2025년에는 234억 달러(33조 7,194억 원)에 이를 것으로 전망
이를 보면 연평균 성장률은 가장 작지만 시장규모가 가장 큰 분야는 은행·금융서비스·보험(BFSI) 이고
평균적으로 높은 연평균 성장률과 시장 규모를 가진 분야는
정부 및 방위, 소매 및 소비재, 제조 분야라고 볼 수 있습니다.
< 지역별 시장규모 및 전망 >

전 세계 빅데이터 시장을 지역별로 살펴보면, 2020년을 기준으로 북아메리카 지역이 30.3%로 가장 높은 점유율을 차지
- 북아메리카는 2020년 420억 9,100만 달러에서 연평균 성장률 9.3%로 증가하여, 2025년에는 656억 2,700만 달러(94조 5,685억 700만 원)에 이를 것으로 전망
- 유럽은 2020년 366억 900만 달러에서 연평균 성장률 10.2%로 증가하여, 2025년에는 595억 4,400만 달러(85조 8,029억 400만 원)에 이를 것으로 전망
- 아시아-태평양은 2020년 323억 7,300만 달러에서 연평균 성장률 11.9%로 증가하여, 2025년에는 568억 2,100만 달러(81조 8,790억 6,100만 원)에 이를 것으로 전망
- 중동 및 아프리카 지역은 2020년 177억 3,500만 달러에서 연평균 성장률 11.4%로 증가하여, 2025년에는 304억 1,100만 달러(43조 8,222억 5,100만 원)에 이를 것으로 전망
- 라틴아메리카 지역은 2020년 100억 7,800만 달러에서 연평균 성장률 11.0%로 증가하여, 2025년에는 170억 2,000만 달러(24조 5,258억 2,000만 원)에 이를 것으로 전망
지역별 통계데이터를 살펴본 결과 북아메리카와 유럽의 시장규모가 가장 크다고 볼 수 있다.
물론 아시아-태평양 시장규모와 크게 차이가나지 않기 때문에 2025년 시장규모는
중동 및 아프리카 , 라틴아메리카지역을 제외하고는 모두 비슷하다고 볼 수 있을 것 같습니다.
종합적인 데이터들을 봤을 때
북아메리카, 유럽, 아시아-태평양 지역에 있는 소매 및 소비재, 제조분야의 대기업에
서비스를 제공하는 기업을 찾는다면
시장의 규모와 트랜드를 모두 잡을 수 있는 기업이라고 볼 수 있을 것 같습니다.
정부 및 방위의 빅데이터를 제공할 수 있는 그리고 어떤 빅데이터를 요구로 하는지 알 수 있는
기업은 각 나라에 속한 기업이어야 하지 않을까 라는 생각과
저는 Nasdaq에서 기업을 분석하기 때문에 미국 정부를 상대로하는 기업이 아니라고 한다면
해당 기업은 제외하고 분석하는게 맞을 것 같습니다.
빅데이터 기업 리스팅
출처 입력
< 알테릭스 >

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.
< 데이터독 >

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.
< 엘라스틱 >

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.
< 스플렁크 >

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.

사진 설명을 입력하세요.
제가 조사하고 있는 빅데이터 기업들이 대체로 부채가 높은 비율로 잡힙니다.
데이터독 ( DDOG ) 이외에는 아직 순이익이 흑자가 난 기업이 없는 것으로 보아
아직 빅데이터 산업에서 순이익이 일어나기에는 힘든 구조이지 않을까 싶습니다.
어떤 이유에서 아직 흑자가 나지 못하고 있는지
또한 위 기업들 중 어떻게 데이터독은 흑자를 낼 수 있었는지에 대해서 알아보겠습니다.
그리고 제가 아직 빅데이터 기업이 어떤 방식으로 돈을 벌고 있는지 잘 모르기도하고
빅데이터 관련 개념이 정리되지 않았기 때문에
일단 몇주동안은 관련 도서를 읽으면서 빅데이터 자체에 대한 분석을 진행해 보겠습니다.
'Investment > 투자분석' 카테고리의 다른 글
크록스 기업분석 (2) (2) | 2022.11.22 |
---|---|
크록스 분석 (1) (0) | 2022.11.22 |
인공지능 기초상식 (0) | 2022.09.27 |
인공지능과 빅데이터 분석 ( 나노디멘션 동향 ) (2) | 2022.09.24 |
나노디멘션 실적발표 (0) | 2022.09.04 |