본문 바로가기

데이터과학/업계 이야기16

Adobe Digital Insight: 2021년 전자 상거래 5대 트렌드 2020년 연말 쇼핑 시즌(11월부터 12월까지) 동안 미국에서 온라인 지출의 비중이 기록을 세웠습니다. Adobe Analytics를 사용하여 미국의 상위 100개 소매 업체 중 80개에 대한 수조 건의 온라인 참여를 분석하는 Adobe Digital Insights (ADI)의 분석에 따르면, 2020년은 코로나19로 인해 사람들이 온라인 쇼핑을 하는 방식에 큰 영향을 미쳤다는 것을 발견했습니다. 최근 연말 연시 휴가 시즌의 전자 상거래 매출은 2년간의 성장과 맞먹는 1,828억 달러에 달해며 전년 대비 32% 증가했습니다. Adobe Digital Insights의 이사인 Taylor Schreiner는 "코로나19 유행병에 비추어 볼 때 디지털 매체는 사람들을 연결하고, 일하고, 즐겁게 지내고, .. 2021. 1. 15.
좋은 데이터 과학자가 좋은 PM이 될 수 있는 이유 저는 데이터 과학자에서 Product Manager(PM)로 경력을 전환 할 때 비슷한 경력 전환을 시도한 많은 사람들에게 조언을 구했습니다. 하지만, "음, 이 전환을 한 사람을 몰라요. 제겐 좀 이상해 보입니다."라는 대답을 정말 많이 들었습니다. 저는 항상 최고의 데이터 과학자가 Product에 초점을 맞추고 사용자와 그들의 요구를 염두에 두고 있다고 생각했습니다. 데이터 과학자와 PM간의 자연스러운 관계 데이터 과학자와 PM은 데이터로 결정을 내립니다. 데이터 과학자의 주요 업무는 평가 측정 항목을 식별하고 특정 개입의 잠재적인 영향을 예측하고 해당 결과를 이해 관계자에게 적절한 기술 수준에서 명확하고 간결하게 전달함으로써 다양한 경쟁 옵션 중에서 선택을 쉽게 할 수 있도록 돕는 것입니다. PM도.. 2021. 1. 12.
추천시스템: 컨텐츠 기반 필터링 컨텐츠 기반 필터링이란? 컨텐츠 기반 필터링은 사용자가 과거에 경험했던 아이템 중 비슷한 아이템을 현재 시점에서 추천하는 것입니다. Information Retrieval과 Machine Learning의 중간 지점 정도라고 생각할 수 있습니다. 즉, 컨텐츠 기반 추천시스템은 정보(아이템)를 찾는 과정과 과거 정보를 활용해서 유저의 성향을 배우는 문제라고 볼 수 있습니다. 아래 그림에서 볼 수 있듯이, 협업필터링과는 개념이 다릅니다. 가령, 웹사이트, 블로그, 뉴스를 구독하고 있는 고객에서 비슷한 컨텐츠의 게시글(item)을 찾아서 추천해 주는 모델을 생각해 보시면 됩니다. 하지만, 컨텐츠 기반 추천시스템은 계속 편향적으로 유저에게 아이템을 추천하는 경우가 많으니 모형을 개발할때 주의해야 합니다. 컨텐츠.. 2020. 12. 18.
인공지능(Artificial Intelligence)의 4가지 유형 이번 포스팅은 미국 미시간 주립 대학교의 Ared Nintze 교수가 Cloud & Computing에 기고한 글을 변역한 것입니다. 원문을 여기를 통해서 읽어보실 수 있습니다. 인공 지능 최신 연구에 따르면 지각 능력과 지능을 갖춘 기계가 완성되기까지 오랜시간이 걸리지 않을 것 같습니다. 기계는 언어 명령을 이해하고, 그림을 구별하고, 자동차를 운전하고 게임을 우리보다 더 잘합니다. 2016년 백악관 보고서에 따르면 인공지능의 미래에 대해 일부 회의적인 견해를 가지고 있습니다. 향후 20년 동안 기계는 "인간과 비슷하거나 그 이상으로 광범위하게 적용 가능한 지능을 보여주지 않을 것"이라고 말합니다. 하지만 앞으로 몇 년 동안 "기계는 더 많은 분야에서 인간 수준의 성능에 도달하고 더 많은 작업에서 인간.. 2020. 12. 13.
시계열 데이터 분석 및 예측을 위한 완벽한 가이드 금융 시장의 추세 또는 전기 소비량을 예측하는 모델에서 시간은 중요한 요소입니다. 예를 들어, 전기 생산량이나 전기 요금을 조정하기 위해 하루 중 어느 시간에 전력 소비가 가장 많을지 예측하는 것은 생각해 볼 수 있습니다. 시계열은 단순히 시간 순서로 정렬된 일련의 데이터 포인트입니다. 시계열 모형에서 시간 정보는 독립 변수이며 최종 목표는 일반적으로 미래를 예측하는 것입니다. 시계열 데이터를 다룰때 다음의 두가지를 중요하게 고려해야 합니다. 시계열의 안정성(by examining stationary test) 시계열의 주기적인 변동성을 의미하는 계정성(seasonality) 오차항의 자기상관(by examining Durbin-Watson statistics) 이번 포스팅에서는 시계열의 다양한 특성과 .. 2020. 12. 11.
코호트 retention을 통한 고객 고객평생가치 (LTV) 추정 이번 포스팅은 고객의 lifetime 가치를 추정하는 2부작 시리즈의 1부입니다. 이 글에서는 2부에서 Python 코호트 분석 예제를 설명하기 위해 필요한 개념석 수준의 고객평생가치(lifetime value, LTV) 추정 방법을 설명합니다. 왜 LTV가 필요할까요? 고객 획득 비용(customer acquisition costs, CAC)에 대한 벤치 마크를 만들고, 고객을 비교하는 데에는 두 가지 이유가 있습니다. LTV를 추정하기 위해 이탈 또는 retention을 사용하는 것에 대해 설명하는 여러 이론들의 핵심 아이디어는 동일하지만 계산 방식은 크게 다릅니다. 따라서, 어떤 분석가는 이번 포스팅을 읽으면 이익을 얻을 수도 있습니다. 하지만 이번 포스팅의 주요 목표는 과거 보유 데이터를 사용하여.. 2020. 11. 14.