Сап, программач мурмурмурмурЯ недо-говно-кодер, не знаю, что такое ООП и очень смутно представляю, что такое, например, O(n).Пару лет назад учил Python и R, сейчас Python почти забыл, на R пишу всякие скрипты по работе (для расчётов, генерации табличек Excel заданного формата, немного операций с текстами и т.д.) Работа слегка макакинговая но скрипты снижают градус уныния.В перспективе хотел бы вкатиться во всякую аналитику и т.п. (немного могу в статистику, совсем немного игрался с Data Mining).Хочу от вас советов мудрых, что мне лучше всего делать дальше.Менять язык на что-то более современное и крутое?Читать книги/проходить курсы, если да, то посоветуйте, какие?Закатать губу, и не лезть в компанию солидных людей?
bump
>>761772 (OP)Ебать ты даже работу нашел с R.Дави в этом направлении, хули.Повспоминай всю хуйню, выучи новую на Dataquest и Datacamp, попробуй себя в Kaggle и замути анализ данных на рабочем месте.Перспективы просто охуенные.
>>761852>Ебать ты даже работу нашел с RНамекаешь, что R никому особо не нужен?>Dataquest Datacamp KaggleСпасибо, анон, загуглю.>замути анализ данных на рабочем местеВряд ли взлетит, для анализа данных у нас есть специально обученные люди, меня пошлют нахуй если я вместо выполнения своих обязанностей начну их дублировать.А есть возможность замутить анализ данных левому дяде по фрилансу?>>761857О чём именно мне с ним поговорить? Я же как бы понимал, на что иду, когда откликался на вакансию.
R умер, сейчас в моде питон. Но по твоему рассказу ты дно какое-то. Тебе надо перепрофилироваться на нормальные обязанности, если не хочешь оказаться в жопе через некоторое время. Вот те специально обученные люди, ты должен стать одним из них.
>>762106>в моде питонВ моде на что?
>>762106Спасибо за мнение.>R умер, сейчас в моде питонПо-моему, всё ещё дохрена людей, особенно в области анализа данных, юзают R.Не пруфанёшь своё утверждение?>те специально обученные люди, ты должен стать одним из нихДа, я хочу, меня интересует, что для этого предпринять.>по твоему рассказу ты дно какое-тоДа, есть немного :-(
>>762106так пистон тоже загибается
Раз тут тред про R, спрошу про свое, но довольно близкое.Я вот через месяц получу диплом врача, но за шесть лет надоело, поэтому последний курс больше угорал по медицинской науке. При этом есть склонность к математике, навыки эникейщика и кое-какие поверхностные знания в "научной статистике".Ну и на данный момент я помогаю с банальной обработкой данных простых исследований. Типа как обезьянка считаю хи-квадраты двумя кнопками Охуительная новость в том, что значительная часть к.м.н. и д.м.н. в душе не ебут, что это и как это делать, такие делаПроблема в том, что это же все методы вековой давности, а на всяких хабрах используют всякие бутстрепы и прочие нейронные сети. Все это в медицинских исследованиях применяется чуть чаще, чем никогда. Видимо, потому что никто не умеет, лол.А мне прям очень хочется этим заниматься, и поле непаханое есть. Но я же, блядь, выпускник меда, и мои знания в математики остановились в районе Ньютона-Лейбница, а теорию вероятностей я не знаю вообще.Какой-нибудь ШАД требует отличных базовых знаний, которых у меня нет. С чего начинать, куда двигаться? Советов мудрых хочу.
>>762177В нашей путяжке аспиранты-быдлокодеры часто брали медицинские темы по договоренности с местным медом (разумеется они косили от армии)
>>762175Одна история упоительнее другой просто.Что же тогда учить, например?
>>762177>всякие бутстрепы и прочие нейронные сети. Все это в медицинских исследованиях применяется чуть чаще, чем никогда. Видимо, потому что никто не умеет, лол.Ну это ты так думаешь. Очень даже применяют в медицине всякие новомодные алгоритмы датамайнинга и машин лернинга, но не в расеюшке, разумеется. В цивилизованном-то мире вон http://www.dmmh.org/ целые международные конференции организуют по вопросам использования датамайнинга в медицине. Наверняка полно и сборников трудов и даже целых серий на эту тему в каких-нибудь шпрингерах.
>>762225Ну, вот именно, что не в рассеюшке и пока довольно далеко от клинической практики, с представителями которой я общаюсь. Мне даже пристать с просьбами "поучите меня" особо не к кому.
>>762216delphi
>>762225Только вот даже в швитой Америке это всё пока глубокая теория, которую не юзают на практике (и непонятно, будут ли).
>>762238>Мне даже пристать с просьбами "поучите меня" особо не к кому. Тута спрашивай. Но применение всяких алгоритмов в медицине ничем не отличается от применения их где угодно еще.
>>762244Почему не Haskell?
>>762274Так я за этим и пришел. Все предыстория про мед тому, что базовых знаний у меня нет и нужна точка старта.Начал пока с курса МФТИ на курсере, нормально?
>>762317Есть жи тред https://2ch.hk/pr/res/752098.html в оп-посте довольно годные ссылки.
>>761772 (OP)О, давно ждал такой тред.
Кто-нибудь сталкивался с пакетом Rcpp? Скажем, есть код на крестах. Как его запустить в R с помощью этого пакета?
>>762093>Намекаешь, что R никому особо не нужен?Нет, просто мне кажется, что в среднестатистичной мухосрани чуть дальше садового кольца 1 на миллион знает за R.>R умер, сейчас в моде питонА вот и нихуя. Надо и пистон и R знать.R - это типа для узколобых статистанов. Они охуенно знают матстат, но не могут в продакшн.Пистон - это куча либ, комьюнити и пиздатые возможности деплоймента.Со временем эталонный дата аналитик прокачивает все эти навыки и превращается в дата сайнтиста.Кстати, лови статьи че ли:https://www.datacamp.com/community/tutorials/r-or-python-for-data-analysishttps://datascientistinsights.com/2013/09/09/data-analytics-vs-data-science-two-separate-but-interconnected-disciplines/И пик говорящий.Кстати, ангельский надо не ниже intermediate.
>>762170>Да, я хочу, меня интересует, что для этого предпринять.Поговори по душам с начальником. Если он не проникнется, пройди ШАД и пытайся в Яндекс.
>>762415>>762170>>762225>>762273Решил вам, бэтмены, ответить скопом. Я пилю проекты в области machine learning / text mining, на питоне. Причины простые - каждый проект раньше начинался с nltk и sklearn, в последние месяцы к ним добавился tensorflow. Мои кореша, занимающиеся анализом картинок, так же сидят на theano/tf/caffe и что там еще на пистоне? Все эти библиотеки делают ведущие научные группы сша/канады/европы в области vision/machine learning/nlp/deep learning.Ждите прорыва в медицине в виде алгоритмов анализа истории болезни, методов анализа вакцин, автоматического анализа МРТ и тд.Часто я встречаю репозитории на Матлабе и почти никогда - на R. Если бы я занимался актуарной математикой или кредитным скорингом - расписал бы тут за R.
>>762592>Я пилю проекты в области machine learning / text mining, на питоне.скажи еще за 300к/сек
>>762613Плюю тебе в лицо, чмоня.
>>762415Спасибо за ссылки, гляну на досуге.Ангельский знаю неплохо, хуже то, что я не погромист ни разу.Пик не понял, не растолкуешь?
>>762592Не понял половины слов, которые ты употребил, но, пожалуй, вспомню и подучу Питон.
>>762720Это из второй статьи. Отличия аналитика от дата сайнтиста.
>>762177>Какой-нибудь ШАД требует отличных базовых знаний, которых у меня нетДля поступления в ШАД требуются алгебра и анализ на уровне первого курса, плюс основы алгоритмов. Вполне можно задрочиться и поступить, пусть и не на бесплатное отделение.
бамп
Не хочу создавать новый тред - поясните за Wolfram Mathematica. Есть ли смысл тамошний язык программирования (я - НИИшник в области материаловедения) для облегчения расчетов или лучше перекатиться в Python?Кстати, практичный вопрос по R - как строить "изотермы" по данным? Скажем, есть у меня график (пикрилейтед), возле каждой точки указано среднее арифметическое значение (состоит из двух-трех замеров с разбросом в 10-20 единиц). Можно ли построить линию, отвечающую значению 40 или 50? Как приблизительно выглядит код?
>>764024>Можно ли построить линию, отвечающую значению 40 или 50?Поясни, пожалуйста, что именно тебе нужно?Линия, отвечающая какому-то значению по оси X или Y, строится функцией ablineНо, судя по твоему графику, тебе нужно не это.
>>764024Ээ, а сажа зачем?
>>764024>практичный вопрос по RПрактический_фиксед-фор-ю_
>>761772 (OP)> Работа слегка макакинговая но скрипты снижают градус уныния.А мне один борщехлеб заливал про матан, что дескать ему платят бабло за НАУКУ (фрилансил на этом R).По сути это ведь тот же Excel? Там тоже были какие-то статистические функции, и диаграмы можно рисовать.
>>764551>По сути это ведь тот же Excel?Как там в 1996? https://cran.r-project.org/web/views/
>>764551>По сути это ведь тот же Excel?Excel - электронные таблицы, R - (недо)язык программирования
>>764094Мне нужно провести линии, которые отвечают какому-то одному значению на графике (пикрилейтед), при этом желательно, чтобы программа учитывала разброс значений в каждой точке.Я когда-то читал известную книгу "An Introduction to Statistical Learning" (дропнул после первой главы и засел за мат. статистику, может когда-то продолжу), так там похожая процедура называлась K-Nearest Neighbors.
>>764993>An Introduction to Statistical LearningУ меня в списке на прочтение лежит уже не первый месяц. Сложная?>Мне нужно провести линии, которые отвечают какому-то одному значению на графикеОхъ. С этим, увы, помочь не могу (я не очень задрачивал всякие джиджиплоты).Могу предложить костыль, как соединить ломаными линиями точки с (примерно или точно) одинаковыми значениями третьей переменной через polygonБудет выглядеть примерно так: (не стал воспроизводить все точки)
>>764775В Excel есть встроенный язык программирования - VBA. В чем отличие от R?
>>764643Что-то я в этом треде не вижу примеров Machine Learning, одни только сраные графики. Покажите, что ваш R реально умеет.
>>765123Тем что vba write-only говно со слабой нужностью.
>>765148Я осознаю, что существуют безмозглые пидоры, у которых в список значимых критериев может входить, к примеру, синтаксис языка. Hу так накласть мне на них. Меня интересуют объективные критерии, а не цацки всякие.
>>765125Делать линейную регрессию сотней разных способов.
>>765125Ну вот посмотри тут, например:https://en.wikibooks.org/wiki/Data_Mining_Algorithms_In_R
>>765123Я ничего не знаю про VBA, анон.Скажи, он умеет парсить текстовые документы или какие-нибудь XML файлы, загружать данные по ссылке из интернетов, запускать код из файла, работать с географическими картами, считать временнЫе ряды или главные компоненты или более 9000 разных статистических тестов?Да, половину этого умеет не сам R, а разнообразные пакеты под него - есть ли такие пакеты под VBA и появляются ли новые так же часто, как для R?А у VBA есть IDE, которая умеет подставлять код, соединяться с системой контроля версий и генерировать self-contained файлы (т.е. и с текстом, и с кодом, который можно запустить) и отчёты в pdf или html?>>765153>синтаксис языкаСинтаксис в R, честно говоря, не очень по сравнению с Питоном.Зато он векторизован, т.е. одной операцией a + b можно почленно сложить 2 набора по N чисел.Да, я довольно поверхностно смотрю на язык, я же нуб.
>>765773забей, про VBA как замена R - это неуклюжий троллинг
Ну что, кто-нибудь придумал, как рисовать "изотермы" этому анону >>764993 >>764024 кроме вот этого >>765058?
>>761772 (OP)Если ты еще живой, то скажи где я проебался?Скачал отсюда http://archive.ics.uci.edu/ml/datasets/Plants
>>766277read.table по дефолту предполагает определённый формат ввода - пробел/таб как разделитель столбцов и т.д. и т.п.Набери в консоли ?read.table и читни справку, если ещё не.В твоём случае лучше всего использовать "сокращённую" функцию:>plants <- read.csv('plants.data', header=F, na.strings = '', stringsAsFactors = F)read.csv по умолчанию считает разделителем столбцов запятую.header = FALSE значит, что у таблицы нет шапки (а её нет).na.strings = '' - пропущенные значения обозначены пустыми строками (это две одинарные кавычки, а не одна двойная)stringsAsFactors = F убережёт от геморроя.
>>766513Дякую он еще и регистрозависимым внезапно оказался
>>766784Не за что.А что ты собрался делать с этими данными?
>>766833Ну мне надо родить красивые графики для диплома и чтобы куча данных была. Пока что-то не очень получается.
Nobody cares