Есть здесь мапредус господа? Прошел пару курсов на edX. Поигрался со спарком. Что дальше? В теории есть сервер куда могу поставить спарк. Аноны, посоветуйте, куда смотреть дальше, какой опыт важен, чтобы не быть rdd.map(lambda x: (x, 1)) болваном?
бамп
>>765186 (OP)Ковыряй MLLib, например, возьми каких-нибудь данных и запили регрессию.
>>765186 (OP)Поддвачну. Как стать бигдата-господином на локалхосте?
>>765977Есть до жопени всяких открытых статистических данных, которые можно выпарсить, либо взять готовые csv/xml, и дальше с ними играть в бигдату, Natural Language Processing и прочие милые вещи.
>>766046> Есть до жопени всяких открытых статистических данных, которые можно выпарсить, либо взять готовые csv/xml, и дальше с ними играть в бигдатуНапример? Что обычно берут для бигдатового хелловорлда?
>>766055Титаник на kaggle
>>765730Ты используешь Спарк на работе? Вы делаете всё то же самое (данные, препроцессинг, разные модели, профит), только на Спарк?
>>766168Начали использовать - прогнозируем поведение пользователей.
>>767080Соболезную вашим пользователям.