Dataiku의 최신 릴리스에는 DataOps 성향이 있습니다.

  • Sep 26, 2023

민첩한 소프트웨어 개발과 마찬가지로 데이터 과학은 모델을 빠르게 테스트하고 반복할 수 있을 때 가장 잘 작동합니다. 데이터 과학 협업 도구인 Dataiku의 최신 릴리스에는 GitHub 및 HipChat과의 통합이 추가되었습니다. 개발자와 데이터 과학자를 하나로 모을 뿐만 아니라 그들의 DevOps 분야 중 일부가 잘.

dataiku-logo.png

데이터 과학과 현재 머신러닝에 대한 과대광고를 고려하면, 협업 플랫폼이 빅데이터 도구 분야에서 가장 빠르게 떠오르는 부문 중 하나라는 것은 놀라운 일이 아닙니다. 주된 개념은 데이터 과학자가 상대적으로 적고 그 수가 적으며 그들의 재능을 최대한 생산적으로 사용해야 한다는 것입니다. 우리의 2017년 주목해야 할 난자 트렌드 빅 데이터에 대한 예측을 통해 우리는 데이터 과학을 팀 스포츠로 만드는 것이 가장 중요한 문제가 될 것임을 확인했습니다.

추천

  • ChatGPT를 사용하여 논문, 프레젠테이션, 연구 등에 대한 연구를 수행하는 방법
  • MacOS에서 Safari가 더 이상 브라우저가 아닌 이유와 대신 사용하는 브라우저
  • iOS 17에서 대기 모드를 사용하는 방법(및 이를 지원하는 iPhone)
  • 구입할 수 있는 최고의 스마트워치: Apple, Samsung 등 비교

등장한 툴링 유형은 매우 다양합니다. 극단적인 경우에는 다음과 같은 야심찬 제안이 있습니다. IBM의 데이터 과학 경험, 그것은 모든 것을 포괄합니다. 노트북에 액세스하고, 수명 주기 동안 데이터 과학 프로젝트를 관리하고, 컴퓨팅 실행을 예약하고, 데이터 계보를 추적할 수 있습니다. 다음과 같은 다른 도구도 있습니다. 도미노 데이터 연구소, 데이터 과학 프로젝트의 수명주기 관리에 더 중점을 둡니다.

그리고 그 분야에 있는 수십 명의 다른 사람들 중에는 데이터이쿠, 데이터 과학자의 생산성을 목표로 합니다.

데이터이쿠(Dataiku)가 출시한다. 4.0 버전 이번 주 데이터 과학 워크벤치의 모습입니다. 새 릴리스의 핵심 주제는 팀워크를 활성화하고 모델 및 알고리즘 개발의 신속한 반복을 가능하게 하는 것입니다. 특히 개발자들에게 인기가 높아진 HipChat과 같은 소프트웨어 코드 커밋 및 채널을 위해 GitHub와의 통합을 추가합니다. 비즈니스 전문가에게 인기 있는 채팅 플랫폼이 된 Slack도 있습니다.

이러한 채널을 활용하면 데이터 과학자가 노트북으로 작업하는 것이 좋다는 사실을 깨닫게 됩니다. 그러나 모델을 프로덕션에 배포하는 일을 담당하는 개발자 및 데이터 엔지니어와 효과적으로 협업하려면 모델이 어떤 가치를 갖고 있는지 이해해야 하는 LOB(Line of Business) 사람들과 함께, 그들이 있는 채널에서 그들에게 다가가야 합니다. 살다.

모든 사람을 같은 입장으로 만드는 것은 단지 문제가 아닙니다. 그것은 또한 속도에 관한 것입니다. GitHub를 활용하면 소프트웨어 개발 수명주기에 대한 링크가 제공됩니다. 민첩한 실천에 푹 빠진 조직의 경우 다음과 같은 신속한 배포 모범 사례를 지원합니다. 데브옵스 빠른 배송을 현실로 만듭니다. 개발자와 운영팀은 반복적으로 변화하는 소프트웨어가 기본 시스템을 불안정하게 하지 않고 신속하게 배포되도록 지속적으로 협력합니다.

"과학"의 정의는 최선의 가설이 확인될 때까지 지속적인 실험을 의미하기 때문에 이 개념을 데이터 과학으로 확장하는 것이 합리적입니다. 데이터 과학의 목표에 기계 학습 모델 개발이 포함되면 학습은 변화하는 시나리오에 대응하여 진화하는 것이기 때문에 더욱 의미가 있습니다. 두 경우 모두 기본 요구 사항은 변경으로 인해 기본 시스템이 불안정해지지 않도록 하는 것입니다.

그 뒤에 아이디어가 있습니다 데이터옵스, 이는 탐르 최고 경영자 앤디 팔머 '소통, 협업, 통합을 강조하는 데이터 관리 방식'이라고 정의합니다. 데이터 엔지니어, 데이터 과학자 및 기타 데이터 간의 협력 자동화 및 측정 전문가."

우리는 데이터 과학 도구와 코드 개발 허브 간의 통합으로 DataOps가 실현될 것이라고 가정하지 않을 것입니다. 결국 기술이 구현되기 전에는 사람과 프로세스가 중요합니다. 그러나 Dataiku와 같은 도구가 이러한 프로세스 링크를 실현할 수 있는 통합을 제공하는 것은 합리적입니다.

비전통적인 경계가 있을 때 데이터를 보호하는 방법: