빅데이터 뒤의 기술, 상업, 사회 차원을 동시에 조사하는 것이 가장 좋다. 발전 성숙도를 보면 기술 차원이 가장 멀리 가고, 비즈니스 차원이 발전했지만 완전히 성숙하지는 않았고, 사교 차원의 발전이 가장 나빴다. (윌리엄 셰익스피어, 윈스턴, 과학명언) 그래서 우리가 빅 데이터에 대해 이야기한 지 오래되었지만, 검색과 같은 빅 데이터 자체를 탄생시킨 몇 가지 분야를 제외하고는 빅 데이터로부터 볼 수 있는 이점이 없습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 빅 데이터명언) 많은 경우, 사람들은 여전히 여기에 금이 있어야 한다고 생각하는 상태에 처해 있지만, 단지 더 많은 인내가 필요하다. (존 F. 케네디, 인내명언) 이 글은 빅데이터 자체의 특징을 발굴하고 미래의 발전 추세를 예측하려고 한다.
빅 데이터의 깊이와 폭
큰 데이터를 대량 데이터에 매핑하면 매우 모호한 개념으로 정보의 대명사가 되는 것과 같습니다. 분명히, 정보가 무엇을 할 수 있는지에 대한 질문에 대답하기가 어렵다.
이때 사고를 촉진하기 위해서는 보통 먼저 분류해야 한다. 시간과 공간을 가장 기본적인 시각으로 삼는다면, 우선 큰 데이터의 깊이와 폭을 구분해야 한다. 시간상으로 볼 때, 빅데이터는 완전한 역사이고, 공간적으로 볼 때 빅데이터는 글로벌 활동의 흔적이다. 전자는 일종의 깊이로 볼 수 있고, 후자는 일종의 폭으로 볼 수 있다. 장면마다 깊이와 폭에 따라 서로 다른 중점을 두고 있다.
의료와 같은 일부 수직 산업의 경우, 큰 데이터의 깊이가 더 중요하다. 데이터에서 모든 역사를 찾을 수 있게 되면 사람들은 해당 업종을 더 잘 이해하고 최적화할 수 있다.
사회에 있어서, 많은 경우 폭이 더 중요하다. 우리는 한 장면의 단편적인 정보만 가지고 있지만, 이 정보가 충분하고 범위가 충분히 넓을 때 비교적 시기적절한 파노라마를 묘사할 수 있다. 자주 인용되는 구글이 전염병을 예측하는 예는 이런 폭에 달려 있다.
이것은 빅 데이터 응용 프로그램의 발전 추세를 결정합니다. 깊이가 중요한 곳은 회사 등 조직이 주체가 되어야 하고, 어려움은 어떻게 데이터 소유권의 경계를 넘을 수 있느냐에 있다. 병원에서는 모든 치료 사례를 디지털화하고 공유하는 것이 유리하지만, 한 병원만 그렇게 한다면 이 병원에서는 사생활 반등의 열세가 될 가능성이 더 높다.
폭이 매우 중요한 곳에서는 검색 등의 분야에서도 혜택을 볼 수 있지만, 실제로 큰 데이터로부터 혜택을 받을 수 있는 조직은 정부입니다. 데이터가 넓을수록 설명의 주체가 커질수록, 사회 전체를 묘사한다면, 이로부터 이득을 보는 것은 분명히 사회의 주요 책임자여야 한다. 이것은 상식적인 문제이며, 진찰을 받을 때 의사가 처방한 약을 먹지 않으면 좋아질 것이다. 때때로 CCTV 가 설날에 바이두의 인원 이동도를 방송할 때가 있는데, 마침 측면에서 이 문제를 설명했다. 이런 인파도는 지도를 할 줄 아는 사람과 회사에 대한 도움보다 정부에 대한 도움보다 훨씬 못하다.
깊이와 폭은 데이터에 대한 요구가 다르다. 전자는 더 상세하고 양질의 데이터 소스가 필요하고, 후자는 요구가 높지 않지만, 둘 다 응용 프로그램에서 모두 보답이 맞지 않는 문제에 직면해 있다. 큰 데이터는 전체를 묘사하는 경향이 있고, 큰 데이터를 수집하거나 처리할 수 있는 능력은 종종 개인입니다. 개인의 보답은 전반적인 승진에서 명확하게 드러나기 쉽지 않다.
현재 빅 데이터 개발의 병목 현상은 기술이 아니라 배후 분배 관계의 수립이다. 이러한 관계가 원활하지 않으면 데이터는 외딴 섬 수준에 머물러 있으며, 각 조직에는' 빅 데이터' 라는 고유한 것이 있습니다. 이런 관계를 바로잡기 위해서, 우리는' 공공지' 가 성립될 수 있을지에 대한 매우 고전적인 질문으로 돌아가야 한다.
데이터 공유 공간의 가정
빅 데이터는 실제로 공공 장소와 비슷합니다. 경제학에서 매우 유명한 논점은 공유지의 비극이다. 미국 경제사는 공공지의 비극이 무엇인지 설명하기 위해 이해하기 쉬운 예를 들었다.
이러한 경제적 추리 명제는 집단 소유제와 생산량의 향유 (동등하거나 고정몫) 가 어떻게' 히치하이킹' 을 초래하는지 설명하기 위해 * * * 토지 소유권을 가진 65,438+00 명의 노동자, * * 65,438+000 부셸 옥수수 생산 한 근로자가 게으름을 피우기 시작했고, 그의 노동량이 절반으로 줄어들어 생산량이 5 부셸로 줄었다고 가정해 봅시다. 생산량 분할제도의 안배로 게으른 사람의 소모량은 현재 다른 노동자들과 마찬가지로 모두 9.5 부셸이다. 그의 노력은 50% 감소했지만 그의 소비는 5% 만 줄었다. 게으른 사람은 남의 노동에 히치하이킹을 하고 있다. …
그 뒤에는 매우 심오한 인간성 문제가 있다. 노력과 협력을 통해 더 많은 부를 창출할 수 있다 해도 개인은 더 많은 것을 공유할 수 있지만, 집단 내에서의 명백한 개인적 경향은 적은 노동이다. (아리스토텔레스, 니코마코스 윤리학, 노력명언) 이것은 실제로 죄수의 딜레마와 관련이 있다.
실물 기반 세계에서 현재 이 문제를 완전히 해결할 수 있는 방법은 없다. 기본적으로 인정받는 분배 질서에 의지할 수밖에 없다. 예를 들면 이전의 혈통은 현재 자연선택이지만 비트 기반 디지털 재산은 현재 이 문제를 해결할 가능성이 있다.
비트 기반 데이터와 실물의 가장 큰 차이점은, 데이터가 내가 가지고 있지 않은 것을 가져가는 것이 아니라, 하드웨어 가격이 빠르게 하락하고, 오픈 소스가 데이터 액세스 도구를 기본적으로 무료로 만든다는 것이다. 이러한 오버레이로 인해 데이터 공유가 가능합니다.
만약 여러분이 제가 얻는 절대값이 점점 커지는 것에 더 관심이 있다면, 데이터 공유지를 형성할 가능성이 더 높습니다. 만약 데이터 공유구가 있다면, 여러분 (기업) 이 더 많은 것을 얻을 수 있기 때문입니다. 하지만 여러분보다 더 많은 관심을 가지고 있다면, 데이터 공유지의 건설은 더욱 어려워질 것입니다. 왜냐하면 공유는 실제로 관계자들을 같은 경쟁의 출발점에 서게 하기 때문입니다.
빅 데이터 통합 마케팅 전문가인 로백휘는 빅 데이터의 문제는 데이터 사용의 기술적 문제이지만 실제로는 데이터 소스의 사회경제적 문제이며, 이는 훨씬 더 어렵다고 생각한다. (윌리엄 셰익스피어, 윈스턴, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터, 데이터) 따라서 빅 데이터 응용 프로그램의 개발은 기술 개발에 달려 있지 않지만 사회 경제적 변화의 속도에 달려 있습니다. 검색, 전자 상거래 및 클라우드 컴퓨팅과 같은 제한된 분야에서는 기술이 완전히 발전했습니다. 현재, 작은 데이터가 큰 데이터가 되는 과정에서 가장 중요한 문제는 누가 돈을 내고 누가 이득을 보는가이다.
빅 데이터의 길은 어디입니까?
데이터 발전의 내재적 동력은 데이터가 완전할수록 그 가치가 커진다는 것이다. 사실, 이것은 또한 네트워크 효과입니다. 거시적으로 데이터 소유권의 발전은 두 가지 추세입니다.
하나는 현재의 모바일 단말기와 같다. 모든 사람은 자신의 개인 데이터 소스를 가지고 있다. 그리고 네가 죽고 사는 경쟁을 벌이며, 마지막 집은 살아남고, 데이터 통일의 최종 목적을 달성할 수 있다. (조지 버나드 쇼, 가족명언)
다른 하나는 경쟁에서 연합하여 위에서 언급한 데이터 공유 공간을 구축하는 것입니다.
앞서 말씀드렸듯이 업계 데이터와 사회 전체의 데이터 성질은 크게 다르므로 따로 논의해야 합니다.
업계 데이터의 경우, 매우 특별한 사람이 없으면 경쟁 업체 간에 솔직하게 협력할 수 없습니다. 이 경우 가장 쉬운 방법은 제 3 자를 도입하는 것입니다.
예를 들어, 모든 운영자는 거의 모든 네티즌의 행동 데이터를 가지고 있지만, 운영자들 간에 공개적으로 협력하고, 이 데이터를 통합하고, 가치를 창출하기는 어렵다. 이때 제 3 자 참여가 있다면 이윤 분배 방안을 마련할 가능성이 있다.
이렇게 할 수 있다면, 유일한 관건은 해당 비즈니스 모델이 데이터 처리 비용을 초과할 수 있는지 여부입니다. 큰 데이터의 가치 밀도는 희소하며, 많은 것들이 가치가 있지만 반드시 할 가치가 있는 것은 아니라는 점을 강조해야 한다. 동영상 사이트가 돈을 벌지 못하는 주된 이유 중 하나는 대역폭과 저장 비용이 비교적 비싸기 때문이다. 하지만 큰 데이터로는 좋은 비즈니스 모델을 찾을 수 없어 동영상 사이트보다 상황이 더 나쁠 수 있다. 광업 비용은 광업 소득보다 낮다.
위의 문제는 업계 데이터에서 그리 크지 않을 수 있습니다. 일반적으로 산업 데이터의 가치 밀도는 결국 더 커질 것이며, 상대적으로 수직이기 때문에 총량은 결국 제한될 것이다. 따라서 빅 데이터의 산업 응용 프로그램은 비교적 쉽게 개발할 수 있습니다.
하지만 소셜 데이터의 경우, 이것은 많은 경우에 문제입니다. 우리 모두는 샘플의 포괄성이 데이터의 어느 정도보다 더 가치 있다는 것을 알고 있지만, 샘플의 포괄성을 보장하는 유일한 수단이 더 많다는 것은 모든 데이터를 가지고 한 가지 일을 하는 것이 의미가 있다는 것을 의미한다. (존 F. 케네디, 데이터명언)
소셜 데이터의 응용 방향은 두 가지가 있습니다. 하나는 기업이 처리할 수 있는 것입니다. 예를 들어 구글과 같은 것입니다. 다른 하나는 스마트 시티 관련 사람의 활동 데이터입니다. 소셜 수준에서는 한 기업에 단독으로 속하기가 어렵습니다. 후자는 위에서 언급한 데이터 공유 공간이 필요합니다.
데이터의 관점에서 볼 때, 데이터 저장소에는 두 가지 형태가 있습니다. 하나는 구글과 같은 기업이 사회 전체의 한 단면에 있는 모든 데이터를 가지고 있다는 것입니다. 이는 특수한 경우여야 하며, 데이터는 공개 정보로 제한됩니다. 일류는 전자상가의 쇼핑 관련, 소셜네트워크서비스, IM 의 사람 관련, O2O 기업의 오프라인 서비스 관련, 12306 의 철도 관련 등 인간의 행동과 관련된 단편화 데이터입니다. 구글은 모든 데이터를 가지고 있지만 사람의 행동은 가지고 있지 않기 때문에 사회 전체의 횡단면 데이터를 가지고 있는 것과 같다. 다른 모든 기업은 하나의 수직 영역에 대한 데이터만 가지고 있습니다.
기업에 의존하여 이 통합 데이터 시도를 한다면 전자는 200 억 위안의 O2O 투자를 할 것이다. 이는 데이터를 완성하기 때문이다. 후자는 사교, 사교, 전기상이 되고 싶은 사람이 있기 때문이다. 비슷한 이야기가 대합실에서도 발생할 수 있다. 이러한 모든 행동의 궁극적인 목적은 한 기업이 이 모든 것을 잘 처리할 수 있다는 것입니다. 그러나 이것은 불가능하며, 경제적 이유 때문만은 아닙니다. 데이터가 열리지 않으면 조각화된 데이터에서만 독선적인 큰 데이터를 만들 수 있다.
따라서 이것은 데이터 공유 공간이 설정될 수 있는지 여부에 대한 문제이며, 데이터 공유 공간을 구축하려면 최소한 누가 해야 하는 문제를 해결해야 한다. (알버트 아인슈타인, 데이터 공유 공간, 데이터 공유 공간, 데이터 공유 공간, 데이터 공유 공간, 데이터 공유 공간, 데이터 공유 공간) 이 오픈 소스는 두 가지 중요한 의미를 가지고 있습니다. 첫째, 수익성 조직이 될 수 없습니다. 둘째, 이것은 많은 기업들의 지지를 받아야 한다. 데이터는 프라이버시를 포함하기 때문에 오픈 소스보다 데이터 사용을 정의하는 더 명확한 규칙이 있어야 합니다.
데이터의 귀속과 사용 문제를 해결할 수 있는 실질적인 방법이 없을 때까지는 빅데이터의 응용이 편향되어야 한다. 그것의 깊이 응용은 사회의 많은 부분의 조화와 관련이 있기 때문에 이 과정은 매우 길어질 수 있다. 흥미롭게도, 빅 데이터의 출현은 기계 지능의 발전을 직접적으로 촉진하며, 기계 지능의 영향은 빅 데이터 자체보다 훨씬 빠를 수 있습니다.
변쇼가 빅 데이터 뒤에 있는 기술, 상업, 사회 차원에 대해 공유한 내용입니다. 더 많은 정보는 글로벌 아이비리그가 더 많은 건품을 공유하는 것에 집중할 수 있다.