О городах и данных


Гео и язык канала: Россия, Русский
Категория: Технологии


Канал про то, кто, как и зачем измеряет города: как исследования,построенные на городских данных, улучшают жизнь в городе и какие риски они несут
Автор:@intra23

Связанные каналы  |  Похожие каналы

Гео и язык канала
Россия, Русский
Категория
Технологии
Статистика
Фильтр публикаций


Репост из: Неизвестно
Требуется UX/UI дизайнер под проект.

Проект - геоинформационное вэб-приложение на стыке классической геоаналитики, урбанистики и ML. Видение приложения есть - нужно грамотно его преобразовать в макеты в Фигме.

Из требований - желательно быть дизайнером именно с уклоном в карты и геоинформатику и иметь примеры реализованных проектов.

тг для откликов: obogatkin


Для любителей "запрыгнуть в последний вагон" осталось 3 места на курс Пространственный анализ и моделирование в Python.

Курс стартует уже завтра 11 апреля

Если есть вопросы или сомнения, пишите в личку:)


#ghsl

Делюсь результатами тестирования данных о застройке с Global Human Settlement database, про которую писала выше, на Лагосе, Нигерия.

Результаты получились негативные, от использования слоя мы отказались.

Теперь почему.

Напомню, что мы хотели использовать данные для оценки высотности. И хотя мы не ожидали точных результатов, получить разделение высотной и одноэтажной застройки мы все же рассчитывали. Не вышло :(

Сравнивали датасет с данными заказчика, который собирал высоту вручную. То есть можно доверять.

Про гипотезы и подход к решению можно прочитать у меня в блоге.

Методы:
1. сравнивали корреляции реальные значения со значением из GHSL

2. Построили linear regression на данных GHSL с таргетом реальной высотой и считали относительный размер ошибки: abs ( floor real-floor ghsl) / floor real) .

3. Делили медианную высоту на категории низкая/высокая застройка и проверяли способность Logistic Regression на данных GHSL предсказать категорию. В модели 1 - низкие, 0 - высокие


Результаты:

1. Футпринт в GHSL (слой GHS-BUILT-S) отличается от данных заказчика (1) и MS buildings footprint (2) - всреднем он больше. Correlation = 0.51 с (1) и 0.56(2) Между (1) и (2), corr = 0.78

2. Высоту посчитали 3мя способами:
1. Median ( floor real)
2. 75 pcntl floor real
3. sum (real volume) / sum( surface)

Лучшая corr = 0.14 с 75 pcntl floor real. То есть связи нет :(

3. Лучший результат Linear Regression: R = 0.04, относительная ошибка ~86%

4. Наконец, Logistic regression. Тоже все печально: лучший результат на 3% лучше рандома, а precision (TP / (TP + FP)) = 35%.
Перебор порога между "низкими" и "высокими" разницы особой не дал, но лучший оказался на 6м

5. И наконец, последняя надежда увидеть закономерности ошибок на карте. Но связи с изменением рельфа или с близостью к морю, мы не увидели🤷‍♀️


Какой из этого вывод:
- Не хочу говорить про бесплатный сыр в мышеловке, но для Нигерии данные себя не оправдали - будем покупать;
- Обязательно валидируйте GHSL перед использованием. Хотя бы сравните футпринт с microsoft.


#course_geoanalytics

Итак, мы отправили письма всем, кто ждал записи на курс с предыдущих потоков, так что проверяйте почты;)

Если вы были в листе ожидания, а вам письмо не пришло, то напишите мне в личку.

А если вы не оставляли ранее заявку, но тоже хотите научиться находить оптимальные локации для кафе или понимать причины выбора ОТ для поездок на работу с помощью пространственных моделей, то переходите на сайт, решайте тест и мы свяжемся с вами:)

Как всегда - вопросы можно задавать в чате канала, как мне, так и участникам прошлых потоков.

P.S. осталось 10 мест, так что лучше не откладывать)


Всем привет!

Полгода пролетели, и я начинаю набор на 4ой запуск курса "Пространственный анализ и моделирование в Python".
🔸Новая дата старта: 11 апреля.

Уже завтра, мы пришлем письма с информацией по курсу тем, кто записывался в лист ожидания и кому не хватило места в 3ьем потоке. Не пропустите и проверяйте спам😁

Для остальных желающих регистрация открыта на сайте - вам сюда!
Проходите тесты и мы свяжемся с вами в конце следующей недели.
Увидимся на занятиях😊


Онлайн-конференция Мапакон

Совсем скоро, в пятницу 29 марта, пройдет онлайн-конференция Мапакон от Картетики ☀️

Мапакон — это целый день погружения в сферу геотехнологий, 36 докладов на тему ГИС и вокруг нее, а еще мастер-класс и географический квиз.

Что будет на конференции:
– доклады о геотехнологиях разной сложности, для новичков и экспертов
– представители бизнеса, которые расскажут про реальные кейсы геоаналитики
– обзор тем ГИС-образования и поиска работы в сфере
– выставка картографических работ
– нетворкинг и новые знакомства

Конференция полностью бесплатна, но обязательно нужна предварительная регистрация. Читайте больше на странице события и регистрируйтесь заранее, чтобы не пропустить ⚡️

P.S.: обязательно посмотрите программу, там найдется что-то интересное для вас. Будут доклады от картографической визуализации до ML в задачах геоаналитики.


🏙 Большая встреча с девелоперами «Строим будущее: как урбанистика и смарт-технологии меняют городскую реальность»

На большой панельной дискуссии в рамках карьерной недели ВШМ СПбГУ встретимся с ведущими девелоперами и урбанистами, чтобы узнать, как современные тенденции в области урбанистики и использование смарт-технологий влияют на запросы жителей, действия застройщиков и общую городскую среду. Встреча организована сообществом урбанистов «Люди в городе».

🔵 СПИКЕРЫ:
Анастасия Шаляпина — ведущий менеджер по развитию продукта, Группа «Самолет»;
Марина Николаева — руководитель блока корпоративной стратегии, Группа «Эталон»;
Елизавета Гречухина — главный архитектор проектов ГК «А101» в Санкт-Петербурге;
Дарина Карасева — сооснователь архитектурного бюро и коворкинга «KLAUZURA»;
Евгения Арефьева — управляющий партнер Института территориального планирования «Урбаника».

🔵 МОДЕРАТОР:
Анастасия Голубева
— к.э.н., доцент и заведующая кафедрой государственного и муниципального управления ВШМ СПбГУ, руководитель Летней школы урбаниста.

У всех слушателей панельной дискуссии будет возможность выиграть подарки за интересные вопросы и принять участие в экскурсии по исторической территории «Михайловской дачи».

📍 30 марта, суббота, 15:00-16:30.
👀 Офлайн, кампус ВШМ СПбГУ «Михайловская дача».
Слушатели из других городов смогут подключиться онлайн, мероприятие открыто для всех.

🔵 Предварительная регистрация обязательна: https://mcw.gsom.spbu.ru/future_registration/


Студенты из СПБГУ делают интересную встречу


Репост из: Неизвестно
Всем привет!

Ищем Фулл-стэк гис разработчик

О компании:
Компания ПИК, Департамент развития земельных активов инициирует и сопровождает приобретение новых проектов ведущего девелопера страны.

О проекте:
Стартап в области PropTech. Наше приложение автоматизирует процесс анализа земельных участков с целью их приобретения, а также накапливает информацию о уже просмотренных территориях.

Чем предстоит заниматься:
— участие в обсуждении и выработке дизайна системы
— разработка нового функционала
— написание документации к разработанным инструментам
— рефакторинг ранее написанного кода (рефакторинг как в процессе внедрения новых фич, так и отдельные задачи по рефакторингу старого кода)

Стек технологий, который мы используем в веб-разработке:
— Angular 13
— RxJs
— Leaflet
— Flask
— PostgreSQL + PostGIS
— MongoDB
— Nginx
— uWSGI

Требования к соискателю:
— Опыт разработки геоинформационных сервисов
— Уверенное пользование Git

Знание:
— Python, знание flask и/или fastapi будет плюсом
— Angular
— SQL, PostGIS

Понимание того, как работают:
— Геоинформационные системы и устройства пространственных данных
— Архитектура REST API

Условия работы
— Создание инновационного продукта в PropTech для ведущего девелопера в стране
— Официальное трудоустройство и белая зарплата по рынку, годовые премии
— Удаленная работа (но есть возможность приезжать в офис)
— ДМС (после окончания испытательного срока)
— Размер оклада обсуждается по результатам собеседования

Прямой контакт для откликов:
@lizabition
beliakovaev@pik.ru


Очень многообещающий источник геоданных нашли мои коллеги: Global Human Settlement Layer . Открывается он только через VPN, но думаю вы справитесь.

Что в нем есть?
9 слоев данных на всю планету, в основном растровых, с информацией о застройке и населении в микромасштабе.

Самые интересные на мой взгляд слои - это средняя высота и суммарные объемы зданий в сетке 100x100 метров, а также слои с прогнозами степени урбанизации до 2030 года.

Из первых идей по использованию этого источника - отделить в городах исследований секторы частной (одноэтажной) застройки от многоэтажной.

Сама качество данных я еще протестировать не успела, но тесты приведенные в документации показывают очень высокий уровень accuracy по всем континентам ( >90%). Догадываюсь, что часть из вас уже работала с этими данными, поэтому велком делиться опытом в чате:)

P.S. как будут апдейты по качеству данных и результаты ресечей, поделюсь здесь и в блоге


Вакансия в команду геоаналитики Лавки, где я работала 2 года назад.

"Всем привет!
В команде Яндекс Лавки открылась роль геоаналитика!📈
Мы сильно растем и с точки зрения географии присутствия, и с точки зрения покрытия текущих регионов новыми дарксторами, поэтому непростых, но интересных задач будет достаточно! Команда геоанализа у нас небольшая, поэтому предлагаем большую зону ответственности и возможность в полной мере оунить большие бизнес-проекты.

📌Чем предстоит заниматься:
- проводить исследования и разрабатывать прогнозные модели по направлению геоаналитики;
- отвечать за расширение географии присутствия Лавки на основе анализируемых данных;
- создавать и запускать оптимальные зоны доставки различных типов доставки;
- поддерживать и развивать наши аналитические инструменты и базы данных;
- выполнять множество запросов ad-hoc от смежных команд: региональных менеджеров, менеджеров продукта, маркетологов и т.д.;
- выстраивать коммуникацию со специалистами по развитию регионов.

📌Мы очень ждем вас, если вы:
- имеете опыт в геоаналитике и работали с инструментами геоаналитики (у нас QGIS), Python и SQL;
- имеете представление об инструментах автоматической отчётности, таких как Tableau и Power BI;
- умеете аргументированно и доступно отстаивать собственную точку зрения и слышать чужие.

Ну и самое главное – готовы работать над сложными и комплексными задачами и помогать расти сервису Лавки💙

Предлагаем гибридный график работы, полный соцпакет с крутой расширенной ДМС, оплатой питания, спортзалом и прочими плюшками, про которые с удовольствием расскажем при встрече)

Если наш проект и задачи вам отклинулись (или у вас есть какие-либо вопросы) – пишите Полине (тг - @polinayandexfoodtech) или откликайтесь по ссылке."


Репост из: data.world
#города #экономика

Геочеки от ФНС
https://geochecki-vpd.nalog.gov.ru/geochecks

Открытые данные Федеральной налоговой службы о потреблении товаров и услуг в различных локациях, агрегированные по гексагональной сетке.

Может пригодиться для исследований городских центров и решения геомаркетинговых задач

1.6k 0 68 13 37

Репост из: qtasep 💛💙
https://scienceos.ai/

Можно позадавать научные вопросы в чатГПТ-стиле, а оно отвечает со ссылками на реальные публикации. Можно даже обнаружить что-то новое в своей области, занятно

(требует регистрации, работает бесплатно)


Потестировала: если четко формулировать вопросы, то в первых топ-10 треть, действительно, окажется самыми цитируемыми работами по теме.


#phd

Мое PhD исследование посвящено оценке влияния удаленной работы на экономику районов. Наличие влияния является гипотезой,основанной на теоретической базе, поэтому может быть как подтверждено, так и отклонено

Почему ожидаются изменения?
Микроэкономическая теория построена на предположении о стремлении системы к равновесию - эквилибриуму. В точке равновесия, спрос равен предложению, существует идеальная конкуренция, и все объекты экономической среды максимизируют удовлетворение (satisfaction) в условии ограниченности ресурсов.

В городе эта идея трансформируется в urban equilibrium. В классической моноцентристской модели города, описанной Алонсо, urban equilibrium представлен в виде равновесия 3-х основных элементов города:

- Residential Equilibrium (жители выбирают место жительства исходя из своего дохода и расстояния до центра города);

- Market Equilibrium ( спрос на землю равен ее предложению);

- Firm Equilibrium (фирмы увеличивают мощности до тех пор пока каждая новая произведенная единица не станет убыточной);

Основное допущение модели - при удалении от центра города цены и плотность населения падают, все рабочие места и развлечения сконцентрированы в центре, поэтому людям приходится каждый день ездить туда

Угрозы и возможности удаленки для районов города.
С удаленкой ценность центра падает, но при этом растет привлекательность окраин ( donnut effect). Поэтому в своем исследовании я предполагаю, что на окраинах города с высоким процентом удаленщиков возникает дисбаланс между спросом и предложением на лучшее жилье и сервисы. Этот дисбаланс является потенциальными угрозой и возможностью для экономики районов.
Угроза
Если житель не может потратить дополнительное свободное время и ресурсы, появившиеся из-за Covid в рамках своего района, то он будет стремиться переехать туда, где это удастся, а значит, район потеряет налогоплательщика, а арендаторы и сервисы - клиента.

Возможность
С другой стороны, для реализации угрозы требуется время - решение переехать оценивается экономистами как "life-changing" и потому считается редким. Это дает возможность локальным властям среагировать на изменившийся спрос и принять меры: мотивировать новое строительство или появление локальных бизнесов. Во-время принятые меры могут не только сохранить текущий уровень экономики, но и увеличить его, привлекая в район новых жителей и сервисы.

В работе я буду тестировать валидность гипотезы изменений и исследовать влияние различных политик на экономику районов


3-ий набор моего курса "Пространственный анализ и моделирование в Python" закончился, а значит, пришло время постов с финальными проектами участников.

Автор 1-ого проекта @arirrr исследовала районы Берлина с целью выбора локации для открытия там вегетарианского кафе. Узнать о том, как расположение галерей и стоимость жилья помогают найти приоритетные локации, можно в описании проекта.

Вопросы пишите в чате канала с тегом автора.


#spatialclustering

В последнее время я много изучаю и тестирую подходы к пространственной кластеризации - оказалось полезным и для работы и для учебы, а, значит, почему бы об этом не написать.

Картинки и примеры можно найти у меня в блоге в этом и в этом постах, а здесь поделюсь основными тезисами. Источник тут

С точки зрения учета локации можно выделить 3 подхода: без использования геометрии, with soft constraint (баланс между локацией и признаками) и spatially contraint (геометрия определяет форму кластера)

1. Без использования геометрии. Идея - выделить похожие районы только на основе их свойств, игнорируя их расположение.
Например, может сработать, если нужно найти локацию похожую на ту, где бизнес успешен.

2. With soft constraint (баланс между локацией и признаками). Идея - добавить к предыдущему подходу x,y или дистанцию до некоторых объектов (например, до моря) в качестве параметров модели. В этом случае кластеры тоже не будут 100% непрерывными, но географическая близость будет учитываться.
Например, может сработать для размещения сети дарксторов

3. Spatialy contraint. Идея, что кластер не может разрываться в пространстве - в основе алгоритмов лежит матрица смежности, которая знает, "кто кому является соседом". Это может понадобиться, например, для проведения таргетированных опросов или рекламных компаний в разных районах города.

Важное замечание: у последних алгоритмов есть еще одна особенность. Если классическая цель кластеризации - найти однородные группы максимально не похожие друг на друга, то в пространстве мы также, можем подбирать кластера, максимизируя население в них или например минимизируя расстояния от центра кластера (пожарной станции) до объектов внутри (домов). Какой подход выбрать - зависит от задачи

Реализацию в python почти всех основных Spatially contraint методов можно найти в библиотеке Spopt.

И красивая картинка, показывающая работу метода 3ьей группы на примере Лагоса прилагается:)


И хотя новый год в Израиле не чувствуется, а в связи с войной в этом году даже елок в городах нет, все-таки захотелось подвести итоги 2023 года и сказать спасибо каждому из вас, кто меня читает😊 Ваши комментарии, лайки, вопросы в личке - все то, что мотивирует меня продолжать писать и экспериментировать.

Итак, я не буду аналитиком, если не начну со статистики:)

Канал

1. За год канал вырос на 39% и теперь нас 1894

2. 69% подписчиков за последний год читали все посты в канале

3. Канал вошел в каталог урбанистических каналов на ряду с другими 120 каналами

4. Наконец, в этом году сбылась моя мечта: канал потихоньку становится открытой площадкой для публикаций исследований и полезных материалов ото всех, кто занимается гео. В 2023 таких постов было 5, надеюсь, в 2024 их станет еще больше💪

Личное геоаналитическое

Оглядываясь на прошедший год, есть несколько результатов, которые я никак не планировала, а потому именно ими хочется поделиться. Но ничего бы из этого не получилось без моих друзей и единомышленников😘

1. Мою с @DrozdovLev карту публичных бомбоубежищ Израиля c 10 октября посмотрели 610K раз - впечатляет, но лучше бы она никому не была нужна. עם ישראל חי

2. Вместе с @mashulkap провели, и судя по отзывам неплохо, 2 набора (37 человек в сумме) курса "Пространственный анализ и моделирование в Python". Неожиданно курс оказался таким востребованным, что только очереди в ожидании хватит на еще 1-2 набора:)

3. На базе канала совместно с @romanovgleb, @sergey_abr и @mashulkap провели GeoConnect, в финале которого приняли участие 15 команд , а запись мастер-класса по QGIS @glebromanov смотрели 500 раз

4. Месяц назад у меня появился свой блог про геоаналитику в Boosty, где уже 19 подписчиков, и где без ограничений телеграмма я делаю разборы статей и новостей, а также делюсь своим опытом решения задач.

Чему я так и не научилась за 2023, так это делать короткие посты. Может быть в следующем году получится🤷‍♀️

Всех с наступающим, мира и вдохновляющих открытий в 2024🥳🥳


Репост из: Неизвестно
Ребята привет) мы ищем геоаналитика к нам в команду, пока решили на сайтах не публиковать и поспрашивать внутри сообщества

Куда: у нас (Wildberries) есть вот эта карта, которую мы постоянно пытаемся сделать лучше. Аналитика в том числе занимается созданием правил по генерации зон (защитных - в которых нельзя ставить ПВЗ, и приоритетных - в которых мы даём бонус при открытии).

Пример решения кейса - вот.
Пример задач:
* Добавить пространственные фичи в модель предсказания оборота (например, посчитать объём нежилых зданий на всё СНГ)
* Написать симуляцию создания заказов, (задача большая, не пугайтесь, со всем поможем) которая бы создавала заказы в домах и генерировала курьеров или клиентов, которые несут заказы из ПВЗ домой (одно из применений - тестирование разных алгоритмов назначения заказов между курьерами)
* Есть ПВЗ с датами открытия и закрытия, оборот по ним, ожидаемый общий прогнозный оборот товаров на март 2024. Нужно: 1. выявить региональный коэффициент годового прироста заказов (март 2023 - март 2024) для каждого региона в отдельности. 2. Учитывая открывшиеся и закрывшиеся за год ПВЗ, предсказать перегруженность конкретных ПВЗ в марте 2024.

Что есть у нас:
Команда (3 геоаналитика, 3 фулстека, все миддл+ или синьоры, у всех большой и интересный опыт, все горят тем, что делают)
Платим 200-250 на руки, хороший офис, в котором дают вкусную бесконечную бесплатную еду, ноутбук можно себе заказать любой (который есть на вб) - компания от него оплатит 40% (остальное - рассрочка на несколько месяцев), но он будет ваш навсегда

Какие у нас есть беды:
* беды с данными - непонятно что откуда куда и почему идёт, везде нужно ходить, узнавать и разбираться
* неразбериха - в целом в компании много хаоса, могут прилетать срочные задачи, которые иногда отодвигают несрочные, но важные проекты

Чего ждём от кандидатов:
* ищем миддл+ (3+ года в программировании и QGIS - каждом по отдельности)
* стек - python (geopandas), PostGIS, QGIS - твёрдый опыт в каждом обязателен
* самостоятельность - всё подскажем, но нужно уметь самому понимать проблему заказчика, преобразовывать в техническое решение, сходить за данными, решить и презентовать кейс
* ищем бодрых ребят (важно), которым интересно заниматься гео (важно)
* хотя бы 2 раза в неделю нужно бывать в офисе в Москве (вам понравится)
* большой плюс если есть опыт в: ML, матстате, osmnx, networkx, momepy

Если хотите попробовать себя - пишите Татьяне с пометкой о том, что вы - кандидат-геоаналитик в команду Рожновской и Романова; Собеседование будет одно на 1.5 часа, где мы совмещаем общую часть с технической, во второй будут код и решение гео-кейсов


Вакансия гео аналитика/ DS в команду Wildberries.
Много данных, интересных пространственных задач и отличная увлеченная команда (знакома с ними лично). Рекомендую👌

Показано 20 последних публикаций.